AI大模型日报#0411：国内首款音乐大模型、面壁智能数亿融资、MyScale AI开源

2024-04-12 20:20:05
开发
21

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。

标题: 大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA

摘要: 大语言模型通过新提出的通用框架，成功实现高精度时序预测，超越传统时序模型，无需额外训练。该框架通过时序输入重编程和提示做前缀两大关键技术，激活大语言模型处理时序数据的能力。这有益于多个领域的决策制定，有望彻底改变时序/时空数据挖掘方式。其中，文本原型用于重编程输入时序数据，使其与大语言模型的自然语言表征对齐。
网址: 大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA | 量子位

标题: 国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦

摘要: 国内首个音乐ChatGPT「天工SkyMusic」内测开启，其改编的周杰伦和凤凰传奇歌曲令人惊艳。团队成功押中Sora架构并公开技术图。同时，Suno V3也带来震撼，不断诞生「神曲」。音乐AI的崛起让业内讨论其可能对音乐产业的影响。初体验「天工SkyMusic」的人声以假乱真，令人梦回80年代，展现其在音乐生成领域的潜力。
网址: 国内首款AI音乐大模型一曲封神！核心技术业内首公开，爆改霉霉周杰伦|音乐|情感|人声_新浪新闻

标题: 为什么要纯C语言手搓GPT-2，Karpathy回应网友质疑

摘要: Andrej Karpathy发布了用1000行C语言/CUDA实现的GPT-2训练项目llm.c，无需依赖庞大的PyTorch或cPython。该项目简化了大模型训练，代码干净、可编译运行，与PyTorch实现相当。项目在GitHub上迅速走红，引发网友热议，有称赞也有质疑。Karpathy对质疑做出回应，详细解释了项目目的和解决的问题。
网址: 为什么要纯C语言手搓GPT-2，Karpathy回应网友质疑 | 机器之心

标题: 「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

摘要: 强化学习在电子游戏环境中表现优越，但在现实复杂应用中受限，如数据获取、样本利用率等问题。大语言模型通过海量数据训练展现了多任务学习、通用知识和推理能力，已被广泛应用到各领域。香港中文大学（深圳）团队调研发现，大语言模型可辅助强化学习提升在多任务学习、样本利用率等方面的表现，特别是在自然语言处理、自动驾驶等复杂应用场景中。相关综述已上传至arXiv网站。
网址: 「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线|深圳市_新浪新闻

标题: “梗王”大模型，靠讲笑话登上CVPR | 中山大学

摘要: 中山大学HCP实验室和合作单位打破大模型常规思维，探索多模态大模型的创造力，让大模型讲笑话并成功入选CVPR顶会。与主流大模型相比，该研究的大模型更具创造力和想象力，能够产生有趣、出人意料的梗和笑话。这项研究展示了探索大模型创造力的新方向，为人工智能领域注入更多乐趣和创意。
网址: "梗王"大模型，靠讲笑话登上CVPR | 中山大学 | 量子位

标题: 「代码大模型」成 AI 新风口，aiXcoder 想让所有企业抢先用上

摘要: 摘要：北京大学软件工程研究所的aiXcoder团队开源了全新自研的7B代码大模型，旨在为企业软件工程带来新可能。与此同时，AI软件开发工具GitHub Copilot已成为AI在开发者应用上的里程碑产品。然而，要让AI真正帮助开发者解决问题，需从软件工程角度出发，解决真实场景中的问题。aiXcoder团队聚焦企业真实开发场景，致力于解决企业私有化部署场景下的软件开发问题。
网址: 「代码大模型」成 AI 新风口，aiXcoder 想让所有企业抢先用上 | 极客公园

标题: 面壁智能完成新一轮数亿元融资，继续面向AGI的高效大模型征程
摘要: 面壁智能近日完成新一轮数亿元融资，由多家知名投资机构领投和跟投，将加大人才引进和底层算力与数据基础的投入，持续推动高效大模型的发展和应用落地。该公司是高效大模型领域的领先团队之一，拥有优秀的研发团队和技术实力，已通过精准建模和实验打造出全球领先的高效训练模式，致力于以更低的成本和更快的速度提供最优的智能解决方案，并引领AI智能体的发展。
网址: 面壁智能完成新一轮数亿元融资，继续面向AGI的高效大模型征程 | 机器之心

标题: 长文本杀不死RAG：SQL+向量驱动大模型和大数据新范式，MyScale AI数据库正式开源

摘要: 大模型和AI数据库结合成为降本增效、实现大数据真正智能的关键。LLM风潮下，模型处理上下文长度的能力成为重要评估指标。尽管有观点认为长上下文模型可能使RAG方法不再必要，但许多研究者和架构师认为数据结构复杂、数据量大且多变，LLM难以单独处理。大模型与AI数据库结合可注入专业、精准、实时信息，降低幻觉，提高系统实用性。
网址: 长文本杀不死RAG：SQL+向量驱动大模型和大数据新范式，MyScale AI数据库正式开源 | 机器之心

原文地址:https://blog.csdn.net/lionkingcz/article/details/137648347 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1778759993487659008.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

AI大模型日报#0411：国内首款音乐大模型、面壁智能数亿融资、MyScale AI开源

相关推荐

最近更新

热门阅读