ECCV2024奖项公布,哥大摘最佳论文,微软COCO数据集获经典论文奖

近日,位列计算机视觉领域三大国际顶级会议的 ECCV 2024 在意大利米兰开幕,本届会议的各奖项已经揭晓。

图片

据大会官方统计,今年共有 2395 篇论文被录用,录用率为 18%,创下近年新低。


昨晚,大会公布了一系列奖项,哥伦比亚大学的研究者摘得最佳论文奖,还有 2 篇论文获得了最佳论文荣誉提名奖。与往届一样,大会还公布了经典论文 Koenderink 奖和 PAMI Everingham 奖。

最佳论文奖

本届最佳论文由来自哥伦比亚大学的两位学者摘得。

图片

论文地址:https://cave.cs.columbia.edu/Statics/publications/pdfs/Klotz_ECCV24.pdf

这篇论文由两位研究者共同完成,他们分别是 Shree Nayar 和 Jeremy Klotz。

Shree Nayar 是哥伦比亚大学计算机科学系的 T. C. Chang 教授。他领导着哥伦比亚视觉实验室(CAVE),该实验室致力于开发计算成像和计算机视觉系统。他的研究主要集中在三个领域:创造提供新形式视觉信息的新型相机,设计基于物理的视觉和图形学模型以及开发从图像中理解场景的算法。他的工作旨在应用于以下领域:成像、计算机视觉、机器人学、虚拟现实、增强现实、视觉通信、计算机图形学和人机交互界面。

Jeremy Klotz 是哥伦比亚大学的三年级博士生,导师是 Shree Nayar,在攻读博士学位之前,曾在卡内基梅隆大学(CMU)与 Aswin Sankaranarayanan 一起工作。

摘要:论文介绍了一种创新的极简主义视觉系统概念。这种系统使用最少数量的像素来完成视觉任务,与传统相机使用大量方形像素网格不同,极简相机采用可任意形状的自由形式像素,以增加信息含量。实现上,这种系统的硬件被建模为神经网络的第一层,通过训练来确定自由形式像素的形状。每个像素由光电探测器和光学掩模实现。研究者设计了几种应用案例,如用 8 个像素进行室内空间监控和光照测量,以及用 8 个像素估算交通流量。尽管像素数量极少,这些系统的性能却与使用多个数量级更多像素的传统相机相当。

极简主义视觉系统具有两个显著优势。首先,它天然地保护了个人隐私,因为捕获的信息不足以提取详细的视觉细节。其次,由于测量次数很少,系统可以完全自供电,无需外部电源或电池。这种创新方法在保护隐私和节能方面展现出巨大潜力,同时又能有效完成特定的视觉任务,为未来视觉技术的发展提供了新的思路。

最佳论文荣誉提名奖

与此同时,ECCV 2024 也公布了最佳论文荣誉提名奖,共有 2 篇论文获奖。

论文 1:Rasterized Edge Gradients: Handling Discontinuities Differentially

图片

论文地址:https://arxiv.org/abs/2405.02508
机构:Meta Reality Labs Research

摘要:计算渲染过程的梯度对于计算机视觉和图形学中的各种应用至关重要。然而,由于不连续性和渲染近似,准确计算这些梯度具有挑战性,特别是对于基于表面的表示和基于光栅化的渲染。研究人员提出了一种新方法,用于计算基于光栅化的可微渲染器在可见性不连续处的梯度。我们的方法通过精心设计的近似策略,优雅地简化了传统上复杂的问题,从而实现了一个直接、有效且高性能的解决方案。

论文 2:Concept Arithmetics for Circumventing Concept Inhibition in Diffusion Models

图片

论文地址:https://arxiv.org/abs/2404.13706
机构:Boston University、University of Washington、University of Pittsburgh

摘要:出于伦理和法律考虑,科学界正在积极开发方法,以限制文本到图像扩散模型的滥用,防止在生成的图像中复制受版权保护的、暴力的、露骨的或个人信息。同时,研究人员通过扮演对手的角色来测试这些新开发的安全措施,以寻找其中的漏洞和后门。

研究人员利用扩散模型的组合属性,这允许在单个图像生成中利用多个提示。这种属性使他们能够结合其他本不应受到抑制影响的概念,重构负责目标概念生成的向量,即使这个向量的直接计算不再可访问。研究人员提供理论和实证证据,说明为什么提出的攻击是可能的,并讨论这些发现对安全模型部署的影响。

他们认为,考虑对手可能采用的所有可能的扩散模型图像生成方法是至关重要的。这项工作开启了关于概念算术和组合推理对扩散模型安全机制影响的讨论。

经典论文:Koenderink 奖

Koenderink 奖旨在表彰计算机视觉领域的基础性贡献研究,获奖论文均为发表时间超过十年并经受住时间检验的研究。

本届的获奖论文是 Microsoft COCO: Common Objects in Context,于 2014 年发表,引用超过 5 万多次。当时,几位作者分别来自康奈尔大学和微软研究院、加州大学伯克利分校、康奈尔大学、布朗大学、加州理工学院、加州大学欧文分校以及 Facebook AI 研究院。

获奖原因指出,该团队在物体识别、场景理解和图像描述领域做出了基础性贡献,通过创建了一个大规模的数据集来推进了计算机视觉研究。

得知获奖后,论文一作、英伟达首席研究科学家 Tsung-Yi Lin 在社交媒体上表示,「我对多模态理解和生成的未来感到兴奋 —— 数据仍将是关键,而我们才刚刚开始。」

摘要:Microsoft COCO (Common Objects in Context) 数据集的目标是通过将物体识别问题置于更广泛的场景理解背景中,来推进物体识别技术的发展。为实现这一目标,研究者收集了包含日常场景中常见物体的复杂图像,这些物体都处于自然的环境中。

数据集使用实例级分割标注来帮助精确定位物体。它包含了 91 种 4 岁儿童容易识别的物体类型,总共有 328,000 张图像,2.5 百万个标注实例。数据集的创建过程利用了新颖的用户界面,通过众包方式进行类别检测、实例定位和实例分割。

研究者还提供了与 PASCAL、ImageNet 和 SUN 等数据集的详细统计比较。此外,他们使用可变形部件模型(Deformable Parts Model)提供了边界框和分割检测结果的基准性能分析。

COCO 数据集的创新之处在于关注日常场景中的常见物体,强调了物体与环境的关系;使用实例级分割标注,提高了物体定位的精确度;数据集规模大,覆盖面广,有助于训练更强大的模型;通过众包和创新的标注工具,保证了数据的质量和多样性。这些特点使 COCO 成为计算机视觉领域,特别是在物体检测、实例分割和场景理解方面的重要基准数据集,推动了相关技术的快速发展。

论文地址 https://arxiv.org/abs/1405.0312

Everingham 奖

该奖项旨在纪念 Mark Everingham,鼓励其他人向他学习,推进整个计算机视觉社区进一步发展。PAMI Everingham 奖授予对计算机视觉社区做出无私贡献的研究者或研究团队,由 IEEE 计算机协会模式分析与机器智能(PAMI)技术委员会颁发。

本届获奖者有两个。

一个是人脸属性数据集 CelebA 团队,成员包括 Ziwei Liu、Ping Luo、Xiaogang Wang 和 Xiaoou Tang。

获奖原因,该团队开发了「一系列数据集,加速了生成式图像建模和许多其他任务的进展。」

CelebA,全称为 CelebFaces Attributes Dataset,一个专为人脸属性识别和分析设计的大规模数据集,由香港中文大学的研究团队开放提供。它包含超过 20 万张名人图像,每张图像都附有 40 个二进制属性注释。这些属性包括但不限于性别、年龄、发型、是否佩戴眼镜等,为研究者提供了丰富的数据样本和详细的标注信息。

另一位本届获奖者是 David Forsyth,因其持续在监督计算机视觉界的会议和期刊方面提供建议和智慧。

David A. Forsyth,出生于南非的美国计算机科学家,是伊利诺伊大学厄巴纳・香槟分校终身教授、计算机视觉领域顶级科学家。现任伊利诺伊州立大学香槟分校正教授、Fulton-Watson-Copp 计算机科学专业主席。

图片

Forsyth 发表了 100 多篇关于计算机视觉、计算机图形学和机器学习的论文。他于 2000 年担任 IEEE 计算机视觉和模式识别项目联合主席、IEEE CVPR 2006 项目联合主席、ECCV 2008 项目联合主席、IEEE CVPR 2011 项目联合主席、IEEE CVPR 2015 项目联合主席和 IEEE CVPR 2024 项目委员顾问。他是所有主要计算机视觉国际会议的程序委员会的正式成员。他在国际计算机视觉会议和欧洲计算机视觉会议上获得了最佳论文奖。Forsyth 的研究兴趣还包括图形和机器学习,他曾担任 ICML 2008 的委员会成员。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Radin Health发布全新一体化AI驱动SaaS解决方案套件

Radin Health,一家领先的前瞻性MedTech公司,宣布推出其AI驱动的全能SaaS解决方案,旨在彻底改变影像中心和远程放射诊断实践。图片{ width=60% }


Radin是一种基于云的RIS、PACS、AI 语音识别和工作流管理平台,利用尖端人工智能、机器学习和自然语言处理工具提高生产力。

放射科医生和影像中心面临着不断增加的工作量、不断上升的劳动力成本和不断下降的报酬压力。Radin Health提供了一种全面的全能解决方案,通过简化运营、降低成本、提高效率,使实践保持竞争力,使员工和放射科医生有更多时间集中精力提高患者体验和结果。

“我们的使命是创新放射学,并提供可以简化工作流程、降低劳动力成本、增加收入和盈利能力的工具,”Radin Health首席执行官放射科医师Alejandro Bugnone博士说。“作为一名经验丰富的放射科医生,同时也是一家忙碌的远程放射诊断实践的业主,我对放射学充满激情,并意识到我们领域未来需要支持。”

全能SaaS解决方案的关键特性:

  • RADIN RIS:自动化患者参与、排班、保险验证、预授权、报告和计费。AI/OCR 技术减少手动任务,提高生产力。
  • RADIN PACS:使用直观界面高效存储和检索图像,利用AI/OCR 提取方法提高准确性和报告交付速度。
  • RADIN DICTATION® AI:具有无与伦比的准确性和速度的语音识别,使放射科医生能够制作高质量报告,同时降低口授时间超过50%,减少倦怠感。
  • RADIN SELECT®:适用于高收占用实践的自动工作流编排器,在多个放射科医生和复杂分配规则下运行。

对放射学实践的改变者:

Radin Health的全能AI驱动SaaS解决方案提供了重大好处:

  • 消除了对本地服务器和维护的需求
  • 直通处理降低劳动力成本
  • 便于未来增长扩展
  • 完全可定制
  • 提高患者体验和结果

“明显有市场需求需要一个能够提供单一、具有成本效益的放射学软件解决方案的合作伙伴,”Radin Health首席商业官Marc Shapiro说。“我们的产品不仅降低运营成本,还能在前端增加收入,并提高员工生产力。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DataPelago发布全球首个通用数据处理引擎

DataPelago今天发布了一款革命性的通用数据处理引擎,用于加速任何引擎,包括开源软件,在任何硬件上使用任何数据类型。图片{ width=60% }


DataPelago的引擎使组织能够从其GenAI和分析工作负载中以前所未有的价格和性能提取价值。该公司以4700万美元的资金从Eclipse、Taiwania Capital、Qualcomm Ventures、Alter Venture Partners、Nautilus Venture Partners和First Citizens Bank的Silicon Valley Bank部门斥资创建。

传统基于CPU和当今软件架构的处理解决方案无法处理每两年翻一番的数据的复杂性和量,其中非结构化数据现在占到创造的所有数据的90%。GenAI的激增及其对巨大体积的非结构化数据的依赖正在加剧处理挑战。DataPelago正在为加速计算时代创建一个新的数据处理标准,以克服这些性能、成本和可扩展性限制。

DataPelago联合创始人兼CEO Rajan Goyal表示:“今天,组织面临着解锁突破性智能和创新的无法逾越的障碍:处理无尽的数据海洋。我们创建了DataPelago来解决这一关键需求。通过应用非线性思维来克服数据处理当前的限制,我们构建了一个能够处理不断增加的各种格式的复杂数据体积指数级增长的引擎,这使得组织真正能够实现其数据的价值。”

DataPelago的通用数据处理引擎可作为端到端解决方案提供,也可与基于Substrait的开源框架集成,从而通过加速计算为Spark和Trino提供动力。它为客户提供了颠覆性的价格/性能优势,而无需更改应用程序或工作流。DataPelago可以无缝集成到现有的数据存储和lakehouse平台中,消除了数据迁移的需要,并避免了供应商锁定。

McAfee的执行副总裁兼首席技术官Steve Grobman表示:“半结构化和非结构化数据的指数增长以及快速的Gen AI/AI采用正在推动创新,不仅仅是在AI领域,也是在数据管理和数据处理领域。”“McAfee自豪地与DataPelago合作设计他们的技术,显示出一些有希望的结果,包括在某些工作负载上显著提高性能和降低成本。”

DataPelago引擎具有创新的架构,由三个层组成,共同将数据处理速度提高一到两个数量级,超过了当今查询引擎的速度。

DataVM - 行业首个具有面向数据运算符的领域特定指令集架构(ISA)的虚拟机,提供了用于在CPU、GPU、FPGA和定制硅元件上执行的公共抽象。
DataOS - 操作系统层,将数据操作映射到异构加速计算元素,并动态管理这些元素以优化规模上的性能。
DataApp - 一个可插入的层,支持与平台(包括Spark和Trino)集成,以为这些引擎提供加速功能。

DataPelago的引擎非常适用于资源密集型的用例,如分析数十亿笔交易,同时确保数据新鲜度,支持AI驱动模型以在数百万个消费者和数据中心端点之间以线速度检测威胁,并提供一个可扩展的平台,以促进快速部署培训、优化和RAG推断管线。

联合创始人兼CEO Rajan Goyal在加速计算解决方案领域拥有20多年的经验,跨越安全、数据移动和数据存储等领域。通过DataPelago,Goyal已经组建了一个跨系统、架构、数据分析、云SaaS、开源开发等领域拥有数十年经验的多学科团队,以打破数据处理在性能、成本和可扩展性方面所面临的限制。

Eclipse的首席执行官和创始合伙人Lior Susan表示:“当数据能够像生成一样快速被提取时,企业就能够利用见解做出更好的决策,运作得更加高效。”“DataPelago的通用数据处理引擎代表了一个将在供应链、可持续能源、医疗领域等领域开启新可能性的范式转变。”

Taiwania Capital Management的常务合伙人吴征表示:“DataPelago有前瞻性地将其引擎巧妙地构建为处理单元不可知的,包括GPU,这将使他们成为数据加速领域的无可争议的领袖。”“DataPelago拥有一个有远见的创始人、一个顶尖团队,并且在每个阶段的旅程中都有经过验证的结果来支持他们的声明。”

要了解有关DataPelago的通用数据处理引擎的更多信息,请访问datapelago.io。

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

POET荣获2024年度优秀奖“年度AI创新者”金奖

POET Technologies Inc. (“POET”或“公司”)(TSX Venture: PTK; NASDAQ: POET)是POET Optical Interposer™、光子集成电路(PICs)和数据中心、通信和人工智能市场的光源的设计和开发者。图片{ width=60% }


今天,在备受尊敬的2024年度优秀奖中,该公司被认定为“年度AI创新者”,获得了技术类别的金奖。这个金奖是该公司最近获得的荣誉之一,还包括被2024年度AI突破奖评为“最佳光学AI解决方案”。
“我们很高兴将POET Technologies公司授予年度AI创新者的荣誉。他们在光子技术领域的突破性进展正在为AI行业设立新标准,推动创新和创意的边界。这一认可证明了他们的领导能力、愿景和革新人工智能解决方案的承诺。我们祝贺POET Technologies整个团队获得这个当之无愧的成就,”优秀奖执行董事玛丽·桑德尔(Marie Zander)表示。
2023年的优秀奖获奖者包括英伟达、英特尔和甲骨文等知名公司。优秀奖成立于2022年,由行业高管、优秀奖工作人员、媒体和顾问共同评选。这些奖项表彰了全球各行业的领军者,他们正塑造着未来。
“POET Optical Interposer™持续获得赞誉,因为其应用的商业可行性正在推进AI网络和数据中心行业领导者的性能目标。我们最近与三菱电机、立讯科技和富士康互连科技达成的协议,展示了为什么行业观察家对POET团队所取得的成就印象深刻,”POET董事长兼首席执行官Suresh Venkatesan博士说道,“获得‘年度AI创新者’金奖是我们平台技术的又一次认可。我们感谢优秀奖的主办方授予我们这一荣誉,并为照亮全球各地变革性公司而努力。”。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

DeepL发布美国技术中心,作为语言AI需求增长的新补充

DeepL,一家领先的全球语言AI公司,今天宣布随着在美国开设首个美国技术中心在纽约市的持续势头和投资。图片{ width=60% }


这个新办公室进一步加强了公司在该地区的立足点,将作为对其业界领先的AI翻译和写作工具需求激增的关键资源。除此里程碑外,公司还宣布了两位专家加入其高管团队:Sebastian Enderlein担任首席技术官,Steve Rotter担任首席营销官。这两位高管共同为公司的领导团队带来超过三十年的行业经验,并将在全球范围内推动战略增长举措,确保DeepL保持在语言AI创新和市场参与的最前沿。

DeepL的新纽约办公室将作为其美国技术中心,重点加速研究和产品开发,以加强其在该地区的市场领导地位,并为其不断增长的美国商业客户网络提供增强支持,其中包括与50%的财富500强和多个行业的领先公司进行合作,如Morningstar Inc.、Zendesk、Coursera等。认识到纽约市拥有强大的多样化技术专业知识和人才库,DeepL正积极为当地的产品和工程职位招聘,并计划在接下来的12个月内将该中心规模翻倍。

“在纽约市开设DeepL的首个美国技术中心将我们定位于市场最大人才库之一的中心,并让我们与我们的客户更加接近,其中包括许多财富500强公司。” DeepL的首席执行官和创始人Jarek Kutylowski表示。“这个中心将推动我们对产品创新和工程的关注,使我们能够提供尖端的语言AI解决方案,帮助我们的客户扩大规模并消除语言障碍。”

这种增长得到了DeepL高管团队的两位执行领导的支持,他们在美国和全球科技产业拥有超过三十年的领导经验:

Sebastian Enderlein,首席技术官,是一位经验丰富的科技领导者,来自Uber、Salesforce和Personio等组织,拥有丰富的全球科技经验。在旧金山待了11年的Sebastian擅长管理国际团队和全球业务扩张,他将主导DeepL工程团队的技术增长。Steve Rotter,首席营销官,拥有超过20年的营销经验,曾在Adobe、Motorola、FourKites、OutSystems和Acrolinx等公司担任职位。Steve位于芝加哥,是两次创业者,拥有两次并购交易和三家独角兽公司经验,现在领导着DeepL的营销团队和品牌建设举措,专注利用数据驱动解决方案和AI增强DeepL和其客户的营销工作。

“AI现在在所有人的脑海中,吸引我加入DeepL的是它对以目的驱动的技术的承诺。DeepL并不仅仅是为了自己而开发AI;它正在解决现实世界的挑战,特别是影响几乎每个企业和个人的语言障碍这个关键问题。” Sebastian Enderlein表示。“这个使命的结合,DeepL团队的抱负以及公司始终保持AI前沿的关注,都让我感到非常激动。我期待着投入并合作,继续推动美国和全球语言AI的边界。”

“作为一名营销人员,我亲眼看到语言如何能够成败于一业。在一个清晰和一致性能够令品牌脱颖而出的世界里,语言障碍是增长的重大障碍,”Steve Rotter表示。“我很高兴加入DeepL,我们正在帮助10万家全球企业更好地与客户联系,拓展市场,并推动他们的品牌更广泛地参与。”

全球企业对AI解决方案的需求正在上升,IBM最近的一项研究发现,有42%的企业正在积极部署AI,40%的企业正在探索AI。在这个不断发展的格局中,DeepL正在引领应用AI来改变预计到2028年将增长到950亿美元的679亿美元语言行业。自2017年成立以来,DeepL已成为全球企业的首选语言AI提供商,提供尖端的翻译和写作解决方案,这是国际业务增长的重要投资,涵盖了从客户服务和营销,到法律文件和内部协作的沟通挑战。DeepL快速扩大的全球客户网络现在包括全球10万多家企业、政府和其他组织,其中包括50%的财富500强。

此次公告是DeepL在一个增长和势头显著的时期的最新里程碑。公司刚刚发布了其术语表功能的更新,并推出了其下一代大型语言模型(LLM),其翻译质量优于GPT-4、谷歌和微软,为个性化、准确性和性能设立了新标准。DeepL最近还入选了《福布斯》2024年云100强榜单,并于五月在著名的后期投资公司Index Ventures的领导下融资3亿美元,估值为20亿美元。

探索AITechPark,了解关于AI、物联网、网络安全、AITech新闻和行业专家的见解的最新进展!

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Zone & Co发布ZoneBilling AI助手

Zone & Co发布ZoneBilling AI助手

新的AI助手增强用户体验,减少支持负担,并为未来的AI功能奠定基础。图片{ width=60% }


Zone & Co,领先的为首席财务官办公室提供ERP扩展软件解决方案的供应商,今天宣布推出划时代的工具ZoneBilling AI助手,旨在通过为用户提供即时的上下文答案,而无需离开他们的工作区域来增强用户体验。这款AI助手代表公司在简化运营和减少财务团队阻力方面迈出的重要一步。

AI助手现在已与ZoneBilling无缝集成,允许用户提出实时问题,并通过从庞大的ZoneBilling知识库和外部资源中汲取信息而获得定制的答复。由于ZoneBilling深度嵌入客户现有的ERP系统中,团队可以在不离开平台的情况下简化其工作流程,实现更快的决策和提高生产效率。这种创新使企业能够减少对支持团队的依赖,提高运营效率,同时保持在熟悉的环境中。

Zone & Co的CTO Hylke Sluis表示:“将AI嵌入ZoneBilling使我们的客户能够更高效地以前所未有的速度提供高价值见解。当定制的见解在应用程序内以工作流程的上下文形式呈现时,客户将获得更大的价值。我们相信,通过利用嵌入的自动化,企业将获得前所未有的效率,并使所有用户能够立即解决他们最紧迫的问题。”

ZoneBilling AI助手的主要特点:

  • 集成式帮助:用户可以直接在ZoneBilling内提交问题,助手会提供即时、具有上下文意识的答案。
  • 可扩展知识:助手利用内部知识库和外部资源,支持多语言,以满足全球团队的需求。
  • 数据安全优先:Zone & Co确保不使用客户数据来训练AI模型,符合ZoneBilling的SOC 1、SOC 2和ISO 27001认证。

Zone & Co的CEO Thomas Kim表示:“我们的愿景是通过在他们工作流程的每个级别集成智能自动化来重新定义财务团队的运作方式,我们认为这只是一个开始。我们致力于通过能够扩展其员工和ERP技术实现更大效率的业务。这款AI助手是我们长期AI战略向前迈出的重要一步,帮助公司减少手动流程,简化运营,并释放增长的新潜力。”

Zone & Co继续投资于人工智能技术,以提升其整个产品套件的效率和可扩展性。今年早些时候,该公司为其AP自动化产品ZoneCapture引入了GenAI数据录入和发票编码功能。这一功能不仅仅局限于传统OCR技术,还能识别并理解发票数据。GenAI在提供无需培训的同时,直观地处理数据,同时提供了灵活性,可以手动调整配置,以适应独特用例。

在不久的将来,Zone & Co的银行对账产品ZoneReconcile将集成“可教授AI”,根据上下文信息和用户之前的对帐模式自动编码账单行。通过真正理解账单行上的数据,而不仅仅应用机器学习的模式,该流程将转变为例外处理,实现更准确和真实时间的银行信息。

ZoneBilling AI助手自9月19日起向部分早期访问客户提供,计划于今年秋季晚些时候进行更广泛的一般发布。Zone & Co鼓励所有客户更新到最新版本的ZoneBilling,以开始利用这一工具。

要了解更多关于Zone & Co的信息,请访问www.zoneandco.com.

感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Voxel51推出FiftyOne开源1.0版本

Popular open source software with over 2M installs marks significant milestone enabling the successful development of visual AI projects
Voxel51, the leading solution for building visual AI applications, today announced the milestone release of version 1.0 of open source FiftyOne. FiftyOne Open Source provides the foundation for Voxel51’s commercial solution, FiftyOne Teams, together bringing unparalleled ease and efficiency to how visual data is used to develop robust and reliable visual AI applications.
Visual data, which already makes up over 60% of all data traffic, is critical to building innovative AI applications that understand and interact with the real world. However, AI builders find themselves without tools capable of handling the ever-expanding volumes and diverse modalities of visual data and putting it to use in developing their AI models and applications. Existing fragmented and inflexible tools result in complex, unwieldy, and often manual processes that lead to delays and failures in over 80% of AI projects.
Integrated Solution for Visual AI Builders
FiftyOne was developed by Voxel51’s team of computer vision and machine learning experts to reinvent how visual data is used in developing AI models and applications. With this milestone open source release, FiftyOne delivers on the vision of an integrated solution that can extract valuable intelligence from diverse visual data and automate the iterative processes of using that data to build robust AI models. Exhibiting exceptional ease-of-use, flexibility, and extensibility essential to fit how AI builders work, the milestone provides comprehensive capabilities to develop and deliver visual AI applications successfully.
This release includes:
Support for additional varieties and forms of visual data – from 3D meshes and scenes to point clouds and geometries – throughout exploration, curation, and model development.
A powerful customizable and extensible framework that enables building interactive data applications, trigger operations, and custom dashboards using Python that aid in fine-tuning models and datasets, while supporting developers in the way they build their visual AI applications.
Adding native vector search integration with Elasticsearch to expand the ecosystem of tools that can be used seamlessly with FiftyOne.
Open sourcing of the core machine learning techniques for data and models in FiftyOne Brain that help uncover hidden structure and relationships in visual data by algorithmically assessing uniqueness, similarity, representativeness, and more.
“It’s impossible to develop reliable, trustworthy visual AI when you’re struggling to curate and understand millions of data samples and how to use them to build AI models that will succeed in real-world applications,” said Voxel51 co-founder and CEO Brian Moore. “This milestone release delivers the solid foundation for innovation in visual AI made possible when every AI builder has the ability to bring quality data and analysis to every step of their development process. FiftyOne’s ease of use, extensibility, and transparency are democratizing best practices for visual AI development, and we’re excited to see our thriving community continue to deliver new value that advances the ecosystem.”
“FiftyOne provides us with a centralized place where we can easily understand data to uncover and resolve problems with our annotations and models. It has been so easy to build with FiftyOne given the numerous integrations and flexibility to dig into the data. No wonder it is quickly becoming the standard in the computer vision community,” said Chris Hall, Data Scientist, Vivint Smart Home.
Harnessing the Power and Promise of Open Source AI
The release of open source machine learning algorithms in FiftyOne Brain demonstrates Voxel51’s continuing commitment to open source AI. The AI ecosystem is at a pivotal crossroads, marked by numerous questions and opinions about the true meaning of open source AI — an uncertainty that could shape the future of this rapidly evolving field. Unlike approaches and vendors that rely on closed, black-box, or only partially open offerings, Voxel51 believes that open source and transparency are critical in all aspects of AI, from models to data to systems.
“Open source makes possible the transparency, collaboration, and rigor needed to deliver continuing innovation in AI,” said Voxel51 co-founder and Chief Science Officer Jason Corso. “We are excited to continue investing in open source so that the entire AI ecosystem can collaborate to deliver better and more robust innovation that is reliable and trustworthy.”
Tens of thousands of AI builders and their teams already rely on FiftyOne for a wide variety of use cases to deliver more accurate and robust models, improving team productivity by up to 50% and model accuracy by up to 30%. FiftyOne Teams, Voxel51’s commercial offering based on open source FiftyOne, is helping leading enterprises and organizations including LG Electronics, Berkshire Grey, and Precision Planting to make visual AI a reality.
To learn more:
Visit us online to discover FiftyOne
Try FiftyOne in your browser
Book a demo
Join the community
Follow us on LinkedIn, X, Slack and GitHub
注意:Title、Date、Body 三个部分的内容,放入到对应的位置。图片{ width=60% }


最后只需要输出为Makedown源文件格式内容。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

MemryX宣布MX3 Edge AI加速器的生产可用性

MemryX,一家在边缘应用中领先的AI加速器创新企业,今天宣布其MX3 Edge AI加速器已进入生产阶段。图片{ width=60% }


MX3现已作为独立芯片和4芯片2280 M.2模块两种形式推出,MX3拥有行业领先的易用性、卓越的性能和高能效特性。
“MemryX团队有数十年将高质量和大批量生产的硅片和软件引入市场的经验,”MemryX的CEO Keith Kressin表示。”经过数月的严格测试,我们非常高兴地宣布我们已经实现了Edge AI加速器的生产里程碑。我们已在数千个AI模型上进行了质量、性能、延迟和准确性测试,确信客户选择MemryX用于边缘AI应用时将非常满意”
改变边缘AI应用的客户体验
在推出具有变革性的MX3解决方案之前,MemryX倾听了经常对其他边缘AI解决方案感到沮丧的客户。MemryX解决方案的主要优势包括:
高帧率– MemryX数据流和内存计算架构在流水线操作方面表现出色。例如,单个低功耗的MemryX M.2卡可以在数十个传入摄像头流上连续运行一个或多个AI模型,这对于边缘应用(如视频管理系统)而言是一个颠覆性的变化。高模型准确度,只需一键点击– MemryX的自动化工具可以在只需一键点击时编译并执行数千个具有高准确性的AI模型。MX3使用浮点激活,并且编译过程保持AI模型的训练方式。这意味着使用MX3的客户无需重新训练模型或在特征图量化期间使用原始图像以提高准确性或近似硅片不支持的运算符。无模型仓库或隐藏模型更改– MemryX不使用或需要模型仓库,即客户模型被修改以适应目标硬件。相反,原始模型在编译和在MX3上运行时保持完全完整。当然,客户始终可以选择对给定模型进行修剪、压缩或精炼,以进行所需的设计权衡。但是MemryX不需要对硬件进行高效和高利用率而进行模型更改。自动预/后处理– 虽然AI处理器用于处理AI工作负载,但许多模型包含专为CPU预处理和后处理设计的代码。程序员必须自行解决预处理和后处理代码。相反,MemryX会自动识别和打包这些代码,帮助程序员使用自动裁切加速应用部署。可扩展性– 单个MX3可以使用,也可以与其他MX3芯片组合,所有这些都可无缝地作为连接到主机的一个逻辑单元。这意味着基于MX3的配置可以从支持智能摄像头中的AI的单个芯片扩展到4芯片边缘PC,再到8或甚至16芯片边缘服务器应用,所有这些都使用完全相同的软件和主机接口,无需添加任何硬件,如PCIe交换机。低功耗– 每个MX3的功耗为0.5-2.0瓦,具体取决于AI模型的要求和系统设置。这使MX3即使在无风扇设备中也能提供高性能的AI计算,例如用于工业PC。整个4芯片M.2模块的功耗不到主流GPU的1/10,同时提供更高的边缘AI性能。广泛支持– MemryX支持一系列x86、ARM和RISC-V平台的即插即用,使用多个操作系统。

客户采用和成功案例
MemryX已经向多个客户提供了样品几个月的时间。客户应用程序正在开发的领域包括零售、安全、农业、汽车、机器人等。凭借极高的易用性和可扩展性,以及工业温度规格,MemryX将成为寻求加速边缘AI处理的客户的首选选择。
“MX3使得华硕能够在边缘提供先进的AI分析,减少计算要求,仅需将MX3添加到现有的IPC设备中,便能为客户提供实时AI推断”,华硕物联网解决方案总监Jessy Li表示。
“DYNICS已将MemryX MX3模块集成到我们的AI驱动平台中,其效果非常惊人。MX3为我们提供了运行最苛刻AI模型所需的计算能力,且功耗极低,使我们能够在具体的工业机会中规模部署AI”,DYNICS的CEO Ed Gatt表示。

可用性
今天,基于MX3的M.2模块可以通过WPG Americas购买。稍后在2024年第四季度,北美和海外的其他经销商将提供MemryX解决方案。此外,2024年第四季度,MemryX将提供一个公开的开发者中心,其中包含展示数百种模型和端应用的开源软件。请访问memryx.com了解更多信息并购买。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

POET荣膺2024年度“AI年度创新者”金奖

POET Technologies Inc.(“POET”或“公司”)(TSX Venture:PTK;NASDAQ:POET),POET Optical Interposer™、光子集成电路(PICs)和数据中心、电信和人工智能市场的光源的设计和开发商,今天荣获2024年度著名Merit Awards技术类别的“AI年度创新者”称号。图片{ width=60% }


金奖进一步增添了公司最近的荣誉,其中包括荣获2024年AI突破奖的“最佳光学人工智能解决方案”认可。
“我们很高兴将POET Technologies荣膺‘AI年度创新者’称号。他们在光子技术方面的突破性进展正在为人工智能行业树立新的标准,推动创新和创意的边界。这一认可证明了他们的领导力、远见和改革人工智能解决方案的承诺。我们祝贺POET Technologies整个团队取得这项当之无愧的成就,”Merit Awards执行董事玛丽·桑德尔表示。
2023年Merit Awards的获奖者包括英伟达、英特尔和甲骨文等知名公司。Merit Awards创立于2022年,由行业高管、Merit Awards工作人员、媒体和顾问组成评审团。该奖项表彰全球各行各业的领军者,这些领军者正在塑造未来。
“由于其应用的商业可行性正在推动AI网络和数据中心行业领袖的性能目标,POET Optical Interposer™持续获得赞誉。我们最近与三菱电机、联宝科技和富士康互联技术达成的协议展示了POET团队取得的成就之所在,行业观察员对此印象深刻,”POET董事长兼首席执行官苏雷什·文卡特萨恩博士表示。“获得‘年度AI创新者’金奖是对我们平台技术的又一次验证。我们感谢Merit Awards组织者的荣誉,并为他们在全球范围内推动变革性公司所作的努力。”



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB

Voxel51推出FiftyOne开源1.0

Popular open source software with over 2M installs marks significant milestone enabling the successful development of visual AI projects Voxel51, the leading solution for building visual AI applications, today announced the milestone release of version 1.0 of open source FiftyOne. FiftyOne Open Source provides the foundation for Voxel51’s commercial solution, FiftyOne Teams, together bringing unparalleled ease and efficiency to how visual data is used to develop robust and reliable visual AI applications. Visual data, which already makes up over 60% of all data traffic, is critical to building innovative AI applications that understand and interact with the real world. However, AI builders find themselves without tools capable of handling the ever-expanding volumes and diverse modalities of visual data and putting it to use in developing their AI models and applications. Existing fragmented and inflexible tools result in complex, unwieldy, and often manual processes that lead to delays and failures in over 80% of AI projects. Integrated Solution for Visual AI BuildersFiftyOne was developed by Voxel51’s team of computer vision and machine learning experts to reinvent how visual data is used in developing AI models and applications. With this milestone open source release, FiftyOne delivers on the vision of an integrated solution that can extract valuable intelligence from diverse visual data and automate the iterative processes of using that data to build robust AI models. Exhibiting exceptional ease-of-use, flexibility, and extensibility essential to fit how AI builders work, the milestone provides comprehensive capabilities to develop and deliver visual AI applications successfully. This release includes: Support for additional varieties and forms of visual data – from 3D meshes and scenes to point clouds and geometries – throughout exploration, curation, and model development. A powerful customizable and extensible framework that enables building interactive data applications, trigger operations, and custom dashboards using Python that aid in fine-tuning models and datasets, while supporting developers in the way they build their visual AI applications. Adding native vector search integration with Elasticsearch to expand the ecosystem of tools that can be used seamlessly with FiftyOne. Open sourcing of the core machine learning techniques for data and models in FiftyOne Brain that help uncover hidden structure and relationships in visual data by algorithmically assessing uniqueness, similarity, representativeness, and more. “It’s impossible to develop reliable, trustworthy visual AI when you’re struggling to curate and understand millions of data samples and how to use them to build AI models that will succeed in real-world applications,” said Voxel51 co-founder and CEO Brian Moore. “This milestone release delivers the solid foundation for innovation in visual AI made possible when every AI builder has the ability to bring quality data and analysis to every step of their development process. FiftyOne’s ease of use, extensibility, and transparency are democratizing best practices for visual AI development, and we’re excited to see our thriving community continue to deliver new value that advances the ecosystem.” “FiftyOne provides us with a centralized place where we can easily understand data to uncover and resolve problems with our annotations and models. It has been so easy to build with FiftyOne given the numerous integrations and flexibility to dig into the data. No wonder it is quickly becoming the standard in the computer vision community,” said Chris Hall, Data Scientist, Vivint Smart Home. Harnessing the Power and Promise of Open Source AIThe release of open source machine learning algorithms in FiftyOne Brain demonstrates Voxel51’s continuing commitment to open source AI. The AI ecosystem is at a pivotal crossroads, marked by numerous questions and opinions about the true meaning of open source AI — an uncertainty that could shape the future of this rapidly evolving field. Unlike approaches and vendors that rely on closed, black-box, or only partially open offerings, Voxel51 believes that open source and transparency are critical in all aspects of AI, from models to data to systems. “Open source makes possible the transparency, collaboration, and rigor needed to deliver continuing innovation in AI,” said Voxel51 co-founder and Chief Science Officer Jason Corso. “We are excited to continue investing in open source so that the entire AI ecosystem can collaborate to deliver better and more robust innovation that is reliable and trustworthy.” Tens of thousands of AI builders and their teams already rely on FiftyOne for a wide variety of use cases to deliver more accurate and robust models, improving team productivity by up to 50% and model accuracy by up to 30%. FiftyOne Teams, Voxel51’s commercial offering based on open source FiftyOne, is helping leading enterprises and organizations including LG Electronics, Berkshire Grey, and Precision Planting to make visual AI a reality. To learn more: Visit us online to discover FiftyOne Try FiftyOne in your browser Book a demo Join the community Follow us on LinkedIn, X, Slack and GitHub。图片{ width=60% }


注意:Title、Date、Body 三个部分的内容,放入到对应的位置。最后只需要输出为Makedown源文件格式内容。



感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB