Project Oscar:谷歌的开源AI维护助手革命

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Project Oscar (https://go.googlesource.com/oscar/+/refs/heads/master/README.md),又称为开放超级大规模抓取聚合语料库,是谷歌宣布的一个开源项目,由一组研究人员和工程师领导。重要成员包括Pedro Ortiz Suarez、Julien Abadji、Rua Ismail、Laurent Romary和Benoît Sagot。

该项目始于2019年,自那时起得到了不同机构的资助和支持。Inria(ALMAnaCH项目团队)和PRAIRIE研究所提供了初始资金。2023年,DFKI和德国联邦经济事务和气候行动部通过OpenGPT-X项目加入,成为主要支持者。

曼海姆大学也在2022年和2023年初提供了资金支持。Common Crawl为Project Oscar提供原始网页数据。其他合作伙伴,如曼海姆大学的数据与网络科学小组和慕尼黑大学,也作出了贡献。这些合作伙伴的参与使得Project Oscar成为AI和ML发展的重要资源。

这个项目到底是干什么的?

“该项目主要提供大量未标注的原始数据,常用于大型深度学习模型的预训练。OSCAR项目开发了高性能的数据管道,专门用于分类和过滤大量网页数据,”组织的介绍页面解释道。

简单来说,它用于收集和清理网页数据,并创建自动化代理来协助开源维护任务。这个过程可以用166种不同的语言进行,适用于全球用户。

Project Oscar的主要使命是为LLMs提供分析自然语言输入的数据集,如问题报告或维护者指示。这些LLMs是训练AI模型的数据集,是语言翻译服务、ChatGPT等聊天机器人和其他AI驱动工具的基础。

Google如何使用Oscar?

Google的Go编程语言团队使用来自Project Oscar的AI代理来管理错误报告和与贡献者的互动。这个自动化系统帮助他们处理问题报告并实时与用户沟通。谷歌宣布,“在谷歌,我们领导许多开源项目,维护这些项目需要大量工作!

“因此,我们创建了Project Oscar,一个AI代理的参考,用于帮助开源项目的维护,从Go项目开始,这个项目有超过93,000个提交和2,000个贡献者,但你可以想象支持各种不同的项目。我们正在开源Project Oscar,所以请查看并告诉我们你希望AI代理能做什么。”

这对科技有何好处?

使用开源意味着更多跨行业、跨世界的合作机会。开发人员能够不断改进和使用该项目。

此外,通过Project Oscar创建的谷歌AI代理处理像错误跟踪这样的日常任务,减少开发人员的工作量,让他们专注于项目的创意部分。这种自动化有助于加快软件开发过程。

在Github上,开发者可以发送邮件给组织提供反馈或提问,也可以访问项目代码。“Oscar与许多以开发为中心的LLMs用途不同,它并不试图增强或取代代码编写过程。

“毕竟,写代码是写软件中有趣的部分。相反,Oscar的想法是专注于不那么有趣的部分,如处理传入问题、将问题匹配到现有文档等,”谷歌提到。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-18 05:50:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-18 05:50:02       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-18 05:50:02       58 阅读
  4. Python语言-面向对象

    2024-07-18 05:50:02       69 阅读

热门阅读

  1. derivate_gauss 将图像与高斯函数的导数卷积

    2024-07-18 05:50:02       21 阅读
  2. 掌握Xcode Storyboard:iOS UI设计的可视化之旅

    2024-07-18 05:50:02       21 阅读
  3. Anylogic中Excel 文件(Excel file)的使用

    2024-07-18 05:50:02       16 阅读
  4. uniapp动态计算并设置元素高度

    2024-07-18 05:50:02       21 阅读
  5. uniapp 解决scroll-view组件 refresher-triggered刷新无效

    2024-07-18 05:50:02       19 阅读
  6. AWS ECS 服务创建 CloudWatch 告警

    2024-07-18 05:50:02       18 阅读
  7. 基于 Vue 3 和 Element Plus 构建图书管理系统

    2024-07-18 05:50:02       24 阅读
  8. Android中Context概述

    2024-07-18 05:50:02       19 阅读
  9. 数据库管理-第221期 Oracle的高可用-04(20240717)

    2024-07-18 05:50:02       21 阅读
  10. 构建自动化:在Gradle中配置项目变量

    2024-07-18 05:50:02       21 阅读