大模型日报
2024-06-25
大模型资讯
大模型产品
大模型论文
- GenoTEX:基因表达数据探索基准
- 摘要: GenoTEX提供自动化基因表达数据探索的基准数据集,包含数据选择、预处理和统计分析,支持LLM方法评估和开发。
- 多模态任务向量实现多样本上下文学习
- 摘要: 本文提出多模态任务向量(MTV),在不调整模型上下文长度的情况下,实现多模态多样本上下文学习,提升视觉与语言任务的性能。
- 梯度掩码调优提升LLM性能上限
- 摘要: 提出梯度掩码调优方法,基于梯度信息选择性更新参数,实验表明其优于传统微调方法,并提升LLM性能上限。
- LLMs在大规模Python代码中的Bug检测能力
- 摘要: 研究评估了LLMs在大规模代码中检测语法错误的能力,发现代码环境更具挑战性,模型性能差异显著,长上下文导致性能下降。
- LongRAG:增强长上下文LLM的检索生成
- 摘要: LongRAG通过处理4K-token单位显著减少检索负担,提升NQ和HotpotQA上的答案召回率和准确率,无需训练即可实现最佳结果。
- 先进多模态深度学习架构用于图文匹配
- 摘要: 本文设计了一种先进的多模态深度学习架构,通过引入新颖的跨模态注意力机制和分层特征融合策略,实现图文特征空间的深度融合与双向交互,并在多项基准数据集上表现出显著性能提升。
- 希腊语播客语料库及弱监督数据的ASR模型研究
- 摘要: 本文利用800小时希腊语播客语料库和Whisper-large-v3生成的银转录,提升ASR性能,验证弱监督数据在低资源语言中的有效性。
- 细粒度引用评估与忠实度指标比较分析
- 摘要: 本文提出一个框架,评估忠实度指标在细粒度引用支持中的效果,揭示其复杂性并提供改进建议。
- V-RECS: 带解释、字幕和建议的低成本可视化推荐系统
- 摘要: V-RECS是首个基于LLM的可视化推荐系统,通过教师-学生范式优化小模型,实现高性能且低成本的可视化生成。
- 少样本推理检测合成歌词
- 摘要: 本研究提出首个高质量合成歌词数据集,评估少样本检测方法,LLM2Vec表现最佳,展示出良好的泛化能力。
大模型开源项目
- ModelScope:探索扩散模型的魔力
- 摘要: ModelScope项目让你体验扩散模型的神奇魅力,使用Python语言编写,适合AI爱好者和开发者。
- Lobe Chat: 多AI提供商支持的开源聊天框架
- 摘要: Lobe Chat是一个开源的现代设计LLM/AI聊天框架,支持多AI提供商和多模态,提供一键免费部署私人ChatGPT应用的功能。
- Doriandarko智能子代理框架
- 摘要: Doriandarko是一个用Python编写的框架,用于智能编排Claude Opus的子代理。
- RAGFlow:深度文档理解引擎
- 摘要: RAGFlow是一款开源的检索增强生成引擎,基于深度文档理解技术,使用Python语言编写。