包含标签 模型推理 的文章

Inference.net 博客Cliptagger 12b --- Inference.net Blog Cliptagger 12b - 知识铺

引言 今天,我们激动地推出 ClipTagger-12B:一个 12B 参数的强大 VLM,在视频帧标题生成方面击败了 Claude 4 Sonnet,同时成本仅为 17 倍。 Inference.net 和 Grass 合作开发了这个开源模型,代表了人工智能的新类别:专为互联网规模的生产工作负载构建的劳模模型。 问题:视频理解成本过高 每天,数十亿个视频帧……

阅读全文

Inference.net 博客将 LLM 推理成本降低到电费水平 --- Inference.net Blog Arbitraging Down Llm Inference To The Cost Of Electricity - 知识铺

无服务器 LLM 推理市场已经爆发,数十家提供商提供各种价格、延迟、可靠性和浮点精度级别的专有和开源模型。虽然选择理想的提供商和 LLM 并不简单,但大多数提供商提供与 OpenAI 兼容的端点,使集成变得简单。这种标准化使得成本成为无服务器开源模型推理的主要差异化因素。随着新的开源模型每周都取得最先进的性能……

阅读全文

推理网博客 智能体搜索 --- Inference.net Blog Agentic Search - 知识铺

RAG 已经触及了天花板,而 RL 训练的智能体刚刚超越了它。 一段时间内,我们只需通过更好的嵌入和重新排序器就能持续改进检索。当时的最佳实践相对简单:通常你会进行稀疏搜索(BM25/SPLADE),密集嵌入搜索,然后使用 RRF(互逆排名融合) 或交叉编码器进行重新排序。这已经足够将搜索质量提升……

阅读全文

AI 代理的有效上下文工程 Killer Code - 知识铺

AI 代理的有效上下文工程 在应用 AI 领域关注提示工程几年后,一个新术语开始崭露头角:上下文工程。使用语言模型构建应用的重点正在从寻找正确的词语和短语转向回答更广泛的问题:“什么样的上下文配置最有可能产生我们期望的模型行为?” 上下文指的是在对大语言模型(LLM)进……

阅读全文

Andrej Karpathy 谈 LLM 辅助编程的演进:哲学与实践的融合 Killer Code - 知识铺

Andrej Karpathy 谈 LLM 辅助编程的演进:哲学与实践的融合 AI 传奇人物 Andrej Karpathy 对多层次 LLM 编程工作流的深度洞察,结合实用的 Claude Code 技巧和策略,探索最佳 AI 辅助开发方案。 Andrej Karpathy 谈 LLM 辅助编程的演进:哲学与实践的融合 “编程感觉完全被可能性所开启,涵盖了多种’编程类型’,然后是各种工具……

阅读全文

一个半月高强度 Claude Code 使用后感受 Killer Code - 知识铺

六月中旬某个闷热的夜晚,在初浅尝试使用 API Key 帮我迅速完成了一个任务后,我毫不犹豫地点下了 Claude Max 的订阅按钮。作为一个"买断制"时代的遗老,每月一两百美金的订阅对当时的我来说还是太超前了。但是在一个半月之后回头望去,看着那些按照 API 计价的被我烧掉的价值 3000 多美金的 toke……

阅读全文

最近文章

福利派送

分类

标签

友情链接

其它