大模型日报2024-06-13

大模型日报

 

2024-06-13

 

大模型资讯

 

  1. FedLLM-Bench:大规模语言模型的联邦学习基准测试

 

  • 摘要: 大规模语言模型(LLMs)在各个领域取得了显著成功,但集中训练需要大量数据。FedLLM-Bench提供了一个联邦学习基准测试,旨在解决这一问题。

 

  1. GPT-4在心理理论测试中表现出色,但在某些社交方面仍有不足

 

  • 摘要: 科学家发现,强大的AI——GPT-4在心理理论测试中的表现几乎与人类相当甚至更好。然而,它在某些社交方面仍存在困难。

 

  1. 新研究将人类认知心理学应用于AI,结果出人意料

 

  • 摘要: 一项新研究使用认知心理学测试来检验大型语言模型(LLMs)的合理性。研究发现,LLMs能够展示出某些方面的认知能力,但结果也揭示了一些意想不到的发现。

 

  1. 阿里巴巴发布多语言模型Qwen2,挑战Llama 3

 

  • 摘要: 阿里巴巴推出最新多语言模型Qwen2,显著提升多语言处理能力,挑战当前最先进的模型Llama 3。

 

  1. 阿布扎比TII发布新一代Falcon2语言模型

 

  • 摘要: 阿布扎比的技术创新研究院(TII)于5月14日发布了其下一系列的Falcon语言模型。新模型具备先进的技术能力,为语言处理领域带来新的突破。

 

  1. MIT研究人员利用大语言模型帮助机器人导航

 

  • 摘要: MIT研究人员开发了一种新技术,通过语言输入为机器人规划路径。这种方法虽然不能超越基于视觉的导航技术,但展示了语言模型在机器人导航中的潜力。

 

  1. 利用AI提升个人健康与保健洞察

 

  • 摘要: 2024年6月11日,谷歌的杰出工程师兼健康技术负责人Shwetak Patel和谷歌研究部首席工程师Shravya Shetty宣布,利用人工智能推进个人健康与保健洞察的发展。

 

  1. Slack使用大型语言模型自动转换15000个单元测试

 

  • 摘要: Slack工程团队利用大型语言模型(LLM),结合抽象语法树(AST),成功自动转换了15000个单元和集成测试中的80%。

 

  1. Inspectus:开源大型语言模型注意力可视化库

 

  • 摘要: Inspectus是一个开源的大型语言模型注意力可视化库,旨在帮助理解大型语言模型的工作原理及其关注点,从而提高其性能。

 

  1. Meta计划使用欧洲用户数据训练AI模型,面临隐私担忧

 

  • 摘要: Meta公司希望利用隐私意识强烈的欧洲用户数据来训练其人工智能模型,但这一举动引发了隐私方面的担忧。

 

大模型产品

 

  1. TeamCreate: 多功能AI员工平台

 

  • 摘要: TeamCreate提供多功能AI员工,适用于财务、销售等多种角色。可通过Slack部署,支持200+应用,任务管理无缝对接。

 

  1. Zeacon:全天候视频营销助手

 

  • 摘要: Zeacon通过AI视频营销,持续吸引、互动和转化网站访客,简化营销流程,提升网站效果。

 

  1. Namify AI:免费AI品牌名生成器

 

  • 摘要: Namify AI提供品牌名生成、商标检查、域名检查、用户名检查,并赠送免费logo,助您轻松创建品牌。

 

  1. Invisibility: Mac上的AI模型集成助手

 

  • 摘要: Invisibility整合GPT-4o、Claude 3 Opus、Gemini和Llama 3,只需按Option+Space即可调用,无需截图或复制粘贴。

 

  1. Autodesigner 2.0:UI设计新革命

 

  • 摘要: Autodesigner 2.0结合ChatGPT对话流和Uizard生成UI,提供易用的UI设计生成器,快速将创意转化为数字产品概念。

 

  1. Review Raven:Figma设计AI助手

 

  • 摘要: Review Raven是Blursday推出的AI助手,能快速分析Figma设计并提供高质量反馈,助你更智能更高效地设计。

 

  1. Onboard:AI技术解决客户邮件难题

 

  • 摘要: Onboard利用先进的AI技术,解决了客户管理和邮件发送的复杂问题,让每位客户的主要收件箱不再错过重要信息。

 

  1. Quest Labs AI动态UI:个性化用户界面

 

  • 摘要: 通过Quest的In-App SDKs,营销团队无需开发、数据或设计团队,轻松实现AI驱动的用户界面个性化。

 

  1. Omi: AI合同与供应商管理平台

 

  • 摘要: Omi是为财务和运营团队设计的AI文件管理平台,集中管理合同,提醒续约和操作事项,轻松搜索与协作。

 

大模型论文

 

  1. Commonsense-T2I挑战:文本生成图像模型的常识理解

 

  • 摘要: 本文提出Commonsense-T2I任务和基准,评估T2I模型生成符合常识的图像能力。实验发现现有模型表现欠佳,旨在推动真实图像生成技术进步。

 

  1. Open-LLM-Leaderboard:LLM评估新基准

 

  • 摘要: 提出Open-LLM-Leaderboard,通过开放式问题评估LLM性能,解决选择偏差和随机猜测问题,并提供代码和数据集。

 

  1. 3D视觉语言推理中的情境感知重要性

 

  • 摘要: 本文提出了SIG3D模型,解决3D视觉语言推理中的情境感知问题,通过在SQA3D和ScanQA数据集上的实验,显著提升了情境估计和问答性能。

 

  1. 基于潜在压缩学习的视觉模型预训练方法

 

  • 摘要: 提出了一种新的视觉模型预训练方法——潜在压缩学习,通过最大化因果注意模型输入输出间的互信息,利用交错图文数据进行预训练,展示了其在视觉表示学习中的潜力。

 

  1. QuickLLaMA:大语言模型的查询感知推理加速

 

  • 摘要: QuickLLaMA通过查询感知推理系统提升LLMs处理长序列的能力,无需额外训练,显著提升准确率。

 

  1. 利用反馈增强合成数据防止模型崩溃

 

  • 摘要: 研究表明,通过反馈增强的合成数据训练大型语言模型可以防止模型崩溃。理论和实验验证了该方法在矩阵特征值计算和新闻摘要中的有效性。

 

  1. THaLLE: 金融分析扩展技术报告

 

  • 摘要: 本文介绍了THaLLE的金融分析扩展,使用8B LLM在CFA模拟考试中表现最佳,并提供细调技术和Flare CFA数据集。

 

  1. 图像文本化:自动生成详细图像描述框架

 

  • 摘要: 本文提出图像文本化框架,利用多模态大模型和视觉专家模型协作,自动生成高质量图像描述,并提出多个基准进行评估。

 

  1. TextGrad: 通过文本自动优化AI系统

 

  • 摘要: TextGrad利用LLM提供的文本反馈优化AI系统组件,适用于多种任务,提升了GPT-4o等模型的性能和应用效果。

 

  1. 对话摘要生成挑战的系统综述

 

  • 摘要: 本文综述2019-2024年对话摘要生成的主要挑战及对应技术,分析评估方法和数据集,探讨未来研究方向。

 

大模型开源项目

 

  1. LeRobot: 现实世界机器人学习

 

  • 摘要: LeRobot是一个使用Pytorch实现的端到端现实世界机器人学习项目,旨在通过深度学习提升机器人性能。

 

  1. 小爱音箱接入ChatGPT改造助手

 

  • 摘要: 使用TypeScript将小爱音箱接入ChatGPT和豆包,改造成个性化的专属语音助手,实现智能对话功能。

 

  1. Apple:可扩展深度学习库

 

  • 摘要: Apple是一个用Python编写的可扩展深度学习库,旨在提供灵活和强大的深度学习解决方案。

 

  1. 快速训练/微调中型GPT的库

 

  • 摘要: Karpathy项目是一个用Python编写的库,旨在提供最简单、最快速的方式来训练或微调中型GPT模型。

 

  1. Xenova:浏览器中运行AI模型

 

  • 摘要: Xenova项目实现了在浏览器中直接运行先进的机器学习模型,无需服务器支持,使用JavaScript编写。

 

  1. Litestar-灵活高效的Python ASGI框架

 

  • 摘要: Litestar是一个生产级、轻量、灵活且可扩展的ASGI API框架,使用Python编写,帮助开发者轻松构建高性能API。

 

  1. Coqui-AI: 先进的文本转语音工具包

 

  • 摘要: Coqui-AI是一个用Python编写的深度学习文本转语音工具包,已在研究和生产中经过实战测试。

相关推荐

  1. 模型日报2024-06-13

    2024-06-13 19:06:03       37 阅读
  2. 模型日报2024-06-10

    2024-06-13 19:06:03       33 阅读
  3. 模型日报2024-06-11

    2024-06-13 19:06:03       46 阅读
  4. 模型日报2024-06-12

    2024-06-13 19:06:03       34 阅读
  5. 模型日报2024-06-15

    2024-06-13 19:06:03       41 阅读
  6. 模型日报2024-06-18

    2024-06-13 19:06:03       47 阅读
  7. 模型日报2024-04-13

    2024-06-13 19:06:03       52 阅读
  8. 模型日报 2024-07-13

    2024-06-13 19:06:03       24 阅读
  9. 模型日报2024-04-12

    2024-06-13 19:06:03       47 阅读
  10. 模型日报2024-04-14

    2024-06-13 19:06:03       42 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-13 19:06:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-13 19:06:03       101 阅读
  3. 在Django里面运行非项目文件

    2024-06-13 19:06:03       82 阅读
  4. Python语言-面向对象

    2024-06-13 19:06:03       91 阅读

热门阅读

  1. 京准电钟|基于纳秒级的GPS北斗卫星授时服务器

    2024-06-13 19:06:03       35 阅读
  2. [12] 使用 CUDA 进行图像处理

    2024-06-13 19:06:03       29 阅读
  3. python替换word文件中的图片

    2024-06-13 19:06:03       37 阅读
  4. 2024.05.31 校招 实习 内推 面经

    2024-06-13 19:06:03       35 阅读
  5. Go版RuoYi

    2024-06-13 19:06:03       32 阅读
  6. 工具:安装R语言的R包的各种方法

    2024-06-13 19:06:03       28 阅读
  7. 深度学习的点云检测

    2024-06-13 19:06:03       32 阅读
  8. 基于深度学习的深度图预测

    2024-06-13 19:06:03       29 阅读
  9. LeetCode 1729, 12, 19

    2024-06-13 19:06:03       29 阅读