大模型日报
2024-06-18
大模型资讯
大模型产品
- 摘要: Olvy 3.0推出AI自动监听和智能标签功能,通过Google Meet集成轻松提取洞察,贴近客户,激发同理心。
- 摘要: PlantIdentify是一款免费植物识别应用,使用AI通过相机或图片快速识别植物,支持多语言并保存识别历史。
- 摘要: VidAU让您通过产品链接或描述,快速生成多语言、多口音的拟真头像视频,并提供换脸、翻译等视频编辑功能。
- 摘要: Teameet是一款AI视频会议平台,新增语音翻译功能,实时翻译并保留讲话者的语调、音高和情感,实现无缝跨语言交流。
- 摘要: rnbw 🌈 是一款现代设计与代码编辑器,简单灵活,开源开放,支持AI,完全遵循开放网络标准。
- 摘要: Drip是一款由AI驱动的自省和日记工具,帮助用户探索内心想法和情感,并将其转化为行动。
大模型论文
- 摘要: 提出金鱼损失,通过随机排除部分训练数据,减少大规模语言模型的记忆化,降低隐私和版权风险。
- 摘要: 本文定义并测量评估基准中的方差,包括种子方差和训练单调性,并提供减少方差的建议。
- 摘要: 本文提出了交错图文理解任务IITC,并引入VEGA数据集以提升模型的图文关联能力,验证了其有效性。
- 摘要: VideoGUI是一种多模态基准,用于评估在视觉为主的GUI任务中GUI助手的表现,涵盖高、中、低三个层次的任务规划和执行。
- 摘要: 引入语义成员推断攻击,通过分析输入及其扰动的语义内容,显著提升成员推断攻击的性能。
- 摘要: 本文提出通过正则化隐状态提升奖励模型在分布转移下的泛化能力,有效缓解RLHF中的过度优化问题。
- 摘要: TRIP-PAL结合大语言模型和自动规划器,生成满足约束和优化用户满意度的旅游计划,实验表明其优于单独使用LLM。
- 摘要: 本文提出Med-HallMark基准和MediHall Score评估指标,用于检测和评估医疗多模态模型中的幻觉,并引入MediHallDetector模型以提高检测精度。
- 摘要: 提出LSP_Offload框架,通过学习子空间投影器,实现LLM在普通硬件上的高效微调,显著提升性能并减少时间。
- 摘要: IntentionQA是一个用于评估语言模型在电商场景中理解购买意图能力的基准,包含4,360个问题,展示了模型在理解和推理方面的不足。
大模型开源项目
- 摘要: comfyanonymous项目提供了一个功能强大的稳定扩散图形界面、API和后端,采用图形/节点界面,使用Python编写。
- 摘要: Ollama项目使用Go语言编写,帮助用户快速上手Llama 3、Mistral、Gemma等大型语言模型。
- 摘要: StableSwarmUI 是一个模块化的稳定扩散网页用户界面,强调易用的强大工具、高性能和可扩展性,用C#编写。
- 摘要: AUTOMATIC1111开发的Stable Diffusion网络界面,使用Python编写,提供便捷的图像生成功能。
- 摘要: 一个开源的ChatGPT克隆项目,支持多种AI模型切换、消息搜索、插件等功能,适合自托管。
- 摘要: Anjok07项目提供一个基于Python的图形用户界面,用于使用深度神经网络技术移除音频中的人声。