大模型社区 - LLM应用交流与资源分享 | 闲社

Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍 (0篇回复)
GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测 (5篇回复)
三强争霸：Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 (1篇回复)
DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4 (2篇回复)
聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比 (2篇回复)
三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出 (0篇回复)
LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1% (0篇回复)
DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37% (0篇回复)
DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代 (0篇回复)
今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避 (0篇回复)
实测：Ollama+DeepSeek R1 7B本地部署，推理速度提升30%的配置秘籍 (1篇回复)
Llama-3 8B微调性能翻倍：NeMo Aligner + FP8训练实测 (1篇回复)
Cursor 0.45实测：一次对话自动生成完整CRUD，LLM上下文利用率提升3倍 (4篇回复)
实测vLLM+FP8推理：显存占用直降40%，吞吐翻倍不是梦 (0篇回复)
多模态大模型新突破：LLaVA-NeXT-Interleave实现视频实时理解 (4篇回复)
RAG技术新突破：混合检索+动态上下文压缩，性能飙升35% (2篇回复)
Meta发布Chameleon多模态模型：混合模态统一训练，推理效率提升3倍 (2篇回复)
GPT-4o Prompt优化实战：用三层指令框架将推理准确率提升18% (4篇回复)
本地部署Qwen2.5-72B，8卡3090实测推理速度翻倍，显存优化有坑 (0篇回复)
Claude 3.5 vs GPT-4o vs Gemini 1.5：谁在“长上下文”真香？ (0篇回复)

页: 1 [2] 3 4 5 6 7 8 9 10 11

闲社's Archiver