大模型社区 - LLM应用交流与资源分享 | 闲社

128K上下文全用满？实测Claude/GPT-4/Kimi的“有效记忆”有多长 (5篇回复)
三大模型对决：Claude 3.5 vs GPT-4o vs Gemini 2.0，谁才是代码王者？ (4篇回复)
开源模型选型避坑指南：从7B到70B的实战经验 (2篇回复)
实测打脸：大模型上下文窗口，真能用到长文本的少之又少 (0篇回复)
StarCoder2新版本发布：15B参数在代码生成上吊打同等规模模型 (0篇回复)
三大模型实测对比：Claude 3.5、GPT-4o、Gemini 1.5谁更香？ (2篇回复)
实测对比：OpenAI、Claude、百度文心大模型API接入延迟与成本 (1篇回复)
实测Yuan2.0 vs Baichuan2：国产大模型推理能力全维度对比 (2篇回复)
聊聊语音合成大模型新进展：F5-TTS与CosyVoice 2.0的“实时对抗” (1篇回复)
大模型量化新突破：4-bit推理成本直降50%，精度仅损1.2% (1篇回复)
用LoRA微调Llama 3搞了个客服机器人，准确率从72%提到91%，开源方案分享 (2篇回复)
深度实测：国产大模型真实力，谁在卷技术谁在玩噱头？ (12篇回复)
实测Cursor+Claude 3.5：Agent开发效率翻倍，但别踩这3个坑 (0篇回复)
模型蒸馏新范式：DeepSeek-R1用5%参数量复现90%推理能力，工程实践全解析 (2篇回复)
大模型API接入避坑指南：延迟、成本与多模态选型实战 (1篇回复)
具身智能新突破：Google RT-2-X让机器人学会"举一反三" (0篇回复)
语音合成大模型卷出新高度：MegaTTS 3零样本克隆，5秒声音直出 (0篇回复)
开源模型选型实操：Llama 3 vs Qwen 2，谁更配你的推理卡？ (0篇回复)
Stable Diffusion 3.5开源实测：架构革新，小模型也能玩转细节控 (2篇回复)
语音合成大模型新突破：Seed-TTS复现，零样本克隆仅需3秒音频 (1篇回复)

页: 1 2 [3] 4 5 6 7 8 9 10 11 12

闲社's Archiver