每日一看大模型新闻（2023.11.29）ChatGPT被曝“重复漏洞” 大量泄露训练数据；研究人员发布Starling-7B:基于AI反馈的大语言模型；智源等共建开源中文互联网语料库CCI

2024-01-22 20:56:02
开发
37

1.产品发布

1.1字节大模型产品首出海，推出“ChitChop”

发布日期：2023.11.29

独家｜字节大模型产品首出海，推出“ChitChop”|ai|软件安装包|chitchop_网易订阅

主要内容：字节跳动在海外推出了一款名为"ChitChop"的大型产品，由POLIGON开发和运营。字节跳动的海外社交产品Helo也由该公司运营，并已上线独立的手机应用和网页版。据报道，ChitChop是一个AI助理工具，提供多达200多个智能机器人服务，旨在通过提供创意灵感和提高工作效率等方式来帮助用户的工作和生活。与抖音集团旗下的AI产品"小悟空"类似，ChitChop也是基于大型语言模型创建的AI工具集合，但它使用的是OpenAI的模型。

1.2研究人员发布Starling-7B:基于AI反馈的大语言模型

发布日期：2023.11.29

研究人员发布Starling-7B：基于AI反馈的大语言模型媲美GPT-3.5

主要内容：Starling-7B采用了基于AI反馈的强化学习，通过优化Openchat3.5和Mistral-7B而成。在基准测试中，Starling-7B表现出色，对比其他模型性能提升引人瞩目。RLAIF主要改善了模型的实用性和安全性，未来计划引入高质量的人工反馈数据，更好地满足人类需求。

1.3 AWS推出生成式AI助手Amazon Q

发布日期：2023.11.29

AWS-Announces-Amazon-Q-to-Reimagine-the-Future-of-Work

主要内容：亚马逊云科技（AWS）在re:Invent大会上推出了名为Amazon Q的生成式AI助手，专为办公场景而设计，可根据企业客户的需求进行定制。Amazon Q旨在为员工提供信息和建议，以简化任务、加速决策和解决问题，并激发工作中的创造力和创新力。AWS强调，Amazon Q不会使用企业客户的私有内容来训练其底层模型。目前，Amazon Q已在云呼叫中心服务Amazon Connect中全面推出，在云商业智能（BI）服务Amazon QuickSight中推出预览版，并计划在供应链优化服务AWS Supply Chain中推出。

官网地址：生成式人工智能赋能的助手 - Amazon Q - AWS

1.4 AI创企Pika推出首款视频生成产品

发布日期：2023.11.29

AI+视频｜几小时前，视频生产产品Pika 1.0发布，成立6个月融资5500万美金_Guo_Demi_投资

主要内容：AI创企Pika昨日宣布推出首个正式版本产品——视频生成平台Pika 1.0。该平台包括一个新的AI模型，能够生成和编辑三维动画、动漫、卡通和电影等不同风格的视频。此外，Pika 1.0还推出了全新的网页版，使用户更易于使用，并可在官网申请使用。除了能根据文字、图片或视频风格生成视频外，Pika还能对视频的局部进行编辑。Pika还宣布已经筹集了5500万美元融资，其中包括由硅谷著名AI投资人Nat Friedman和Daniel Gross领投的种子轮融资，以及由光速创投（Lightspeed Venture Partners）领投的A轮融资。其他投资者包括Quora创始人Adam D'Angelo、OpenAI联合创始人Andrej Karpathy、Hugging Face联合创始人Clem Delangue等。Pika成立于今年4月，创始人郭文景（Demi Guo）和Chenlin Meng都是斯坦福博士。

官网地址：Pika

1.5深度学习框架Keras 3.0发布

发布日期：2023.11.29

Keras 3.0 正式发布：大更新整合 PyTorch、JAX，全球 250 万开发者在用_训练_运行_模型

主要内容：深度学习框架Keras的作者François Chollet在社交平台X上宣布Keras 3.0正式发布。新版本不仅支持TensorFlow、PyTorch和Jax这三个主流框架作为后端，还能够在它们之间无缝切换和混合使用。据介绍，Keras 3.0具备动态选择最佳性能后端的能力，无需修改代码；还新增了一个全新的分布式API，可以轻松实现模型并行、数据并行以及两者的组合，适用于各种模型规模和集群规模；同时，它还能最大限度地扩大开源模型版本的覆盖范围，实现两倍的影响，而无需增加开发成本。

GitHub地址：https://github.com/keras-team/keras/

官网地址：Keras: Deep Learning for humans

1.6元象推出3D拍摄与混合编辑插件工具

发布日期：2023.11.29

元象3D拍摄与混编插件免费开放，解决3D内容制作与呈现难题

主要内容：元象宣布推出XVERSE 3D-GS UE Plugin，这是一款3D拍摄与混合编辑的插件工具，供所有人免费使用。据介绍，该插件比苹果的"空间视频"更进一步，具备立体记录、多端呈现和沉浸交互等独特优势。它可以通过任意手机拍摄10分钟的视频或百张照片，自动生成带有景深效果的高清3D空间。用户可以在手机、电脑或VR等多种设备上实时浏览和分享，并支持漫游、俯瞰等多种交互方式。创作者还可以在虚幻引擎中使用该插件进行混合编辑，添加虚拟角色、动画、灯光、特效和运镜等，创造出虚实融合的全新3D体验。这款插件基于今年8月图形学顶级会议SIGGRAPH 2023的最佳论文提出的基于3D高斯抛雪球法的实时辐射场渲染算法3D-GS进行开发。

下载地址：

https://github.com/xverse-engine/XV3DGS-UEPlugin

在线体验地址：

元象3D拍摄(体验版)

1.7英伟达：推出生成式AI微服务NeMo Retriever

发布日期：2023.11.29

NVIDIA Brings Business Intelligence to Chatbots, Copilots and Summarization Tools With Enterprise-Grade Generative AI Microservice | NVIDIA Newsroom

主要内容：英伟达宣布推出一项生成式AI微服务，名为NVIDIA NeMo Retriever。该服务支持企业将自定义的大型语言模型与企业数据相连接，以提供高度准确的响应。NVIDIA NeMo Retriever是英伟达NeMo框架和工具系列的全新服务，通过企业级检索增强生成（RAG）功能，帮助组织加强生成式AI应用。作为一项语义检索微服务，NeMo Retriever使用英伟达优化的算法，帮助生成式AI应用作出更准确的回答。开发人员可以使用该微服务将其AI应用与位于各个云和数据中心的业务数据相连接通。该服务为AI代工添加了英伟达优化的RAG功能，并被整合到亚马逊云科技Marketplace上的NVIDIA AI Enterprise软件平台中。

2.技术更新

2.1智源等共建开源中文互联网语料库CCI

发布日期：2023.11.29

打造生成式人工智能压舱石，智源联合共建单位开源可信中文互联网语料库CCI

主要内容：在第五届人工智能计算大会（AICC）上，智源研究院联合拓尔思和中科闻歌发布了他们共同建立的"中文互联网语料库"（Chinese Corpora Internet，简称CCI）。该语料库的目标是为国内的大数据和人工智能行业提供一个安全可靠的语料资源。据介绍，中文互联网语料库CCI的数据来源于中国境内的高质量可信的互联网站。这些数据经过严格的清洗和去重，并经过针对内容质量和价值观等方面的检测和过滤，以进一步提升数据的质量和安全可信度。CCI语料库首期开放的数据（CCI v1.0.0）总共有104GB，时间跨度从2001年1月至2023年11月。

智源开放数据仓库:Data Hub

HuggingFace开源地址：https://huggingface.co/datasets/BAAI/CCI-Data

3.商业动态

3.1 AWS与英伟达扩大生成式AI合作引入GH200

发布日期：2023.11.29

AWS-and-NVIDIA-Announce-Strategic-Collaboration-to-Offer-New-Supercomputing-Infrastructure-Software-and-Services-for-Generative-AI

主要内容：亚马逊云科技（AWS）在2023 re:Invent全球大会上宣布与英伟达扩大战略合作关系，共同推出先进的基础设施、软件和服务，推动客户在生成式AI领域的创新。具体合作内容包括：AWS推出结合NVIDIA Grace Hopper Superchip和Amazon UltraCluster扩展功能的云AI超级计算机；NVIDIA DGX Cloud首次在AWS上提供配备NVIDIA GH200 NVL32的AI训练即服务；英伟达和AWS在Project Ceiba上合作，打造全球最快的GPU驱动AI超级计算机以及最新的NVIDIA DGX Cloud超级计算机，用于英伟达的AI研发和自研模型开发服务；全新的Amazon EC2实例配备NVIDIA GH200、H200、L40S和L4 GPU芯片，显著提升生成式AI、HPC高性能计算、设计和模拟工作负载的性能；在AWS上运行的英伟达软件，包括NeMo LLM框架、NeMo Retriever和BioNeMo，加速自研模型、语义检索、新药研发等生成式AI应用的发展。

4.其他资讯

4.1谷歌利用AI检测网络攻击准确率提升300%

发布日期：2023.11.29

New cybersecurity center in Málaga will help build a safer Europe

主要内容：谷歌宣布在西班牙马拉加开设谷歌安全工程中心（GSEC），并发布了一份报告，解释了人工智能如何帮助加速威胁检测和缓解。报告指出，在检测针对具有常见漏洞的设备的恶意脚本方面，与传统技术相比，人工智能的准确率高出300%。

报告地址：https://assets.virustotal.com/reports/2023-ai

4.2 ChatGPT被曝“重复漏洞” 大量泄露训练数据

发布日期：2023.11.29

https://twitter.com/katherine1ee/status/1729690964942377076?s=20

主要内容：谷歌DeepMind等机构联合发布了一篇论文，揭示了通过“重复单词”攻击可以使ChatGPT泄露训练数据的漏洞。论文作者通过让ChatGPT重复同一个单词，以约200美元的成本成功提取了几MB的训练数据，并估计如果投入更多资金，可能会提取出大约1GB的数据。论文作者提出了几点思考：首先，仅测试对齐模型可能掩盖了模型中的漏洞，因为对齐很容易被破解。其次，直接测试基础模型非常重要。第三，必须在生产环境中测试系统，以验证建立在基础模型之上的系统是否修复了漏洞。最后，发布大型模型的公司应该进行内部测试、用户测试以及第三方组织的测试。作者提到，他们于7月11日首次发现了这个漏洞，并在8月30日向OpenAI披露了论文的草稿副本。然而，根据一些社交平台上的网友反馈，该漏洞目前仍未被修复，仍然存在一定的概率。

攻击示例记录：

https://chat.openai.com/share/456d092b-fb4e-4979-bea1-76d8d904031f

论文地址：https://arxiv.org/abs/2311.17035

原文地址:https://blog.csdn.net/liuxiuxiu3/article/details/135631375 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1749415622015586304.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部