百度发布全球领先文档解析模型 PaddleOCR-VL,重塑OCR技术格局! --知识铺

近日,百度正式发布并开源其自研的多模态文档解析模型 PaddleOCR-VL。这一模型在全球权威的文档解析评测榜单 OmniBenchDoc V1.5中,以92.6分的佳绩荣登综合性能全球第一的宝座,展现出其在文本、表格、公式和阅读顺序四大核心能力上的卓越表现。 PaddleOCR-VL 的核心模型参数仅为0.9B,具有轻量高效的特……

阅读全文

AI音乐创作成程序员新副业:单曲播放破200万,版权收入数万元 --知识铺

2025年,AI音乐创作工具的普及正在改变音乐行业的创作格局。今年1月,一位《原神》玩家使用游戏台词结合AI作曲工具Suno创作的歌曲《奥奇坎竟是我自己》在B站获得近640万播放量,引发了关于AI创作能力的广泛讨论。 程序员群体成为AI音乐创作的活跃参与者。今年3月,程序员Yapi……

阅读全文

2025天猫双11成AI商业落地新里程碑:发布6款AI导购应用 --知识铺

16日,阿里巴巴宣布首个 AI 全面落地的天猫双11,AI 技术将深度融入流量分发、消费者体验和商家经营的全链路,为消费者带来更智能、更高效的购物体验,同时帮助商家实现增长与降本增效。 在天猫双11发布会上,阿里巴巴中国电商事业群搜推智能总裁凯夫表示:“‘好用的AI’是淘宝AI应用的检验标……

阅读全文

维基百科因 AI 聊天机器人流量下降,担忧可持续发展 --知识铺

维基百科运营方维基媒体基金会近日表示,由于越来越多用户通过 AI 聊天机器人和搜索引擎直接获取维基百科上的信息,导致其人类访问流量显著下降。这一现象引发了基金会对维基百科未来可持续发展的担忧。 维基媒体基金会的高级总监 Marshall Miller 在官方博客中指出,虽然人们以新的方式获取知识是受欢迎的,但 AI 工具和……

阅读全文

旅行搜索引擎Kayak推出 “AI 模式” 旅行规划与预订更便捷 --知识铺

近日,旅行搜索引擎Kayak宣布推出全新的 “AI 模式”,该功能使用户可以通过内置聊天机器人在其网站上直接研究、规划和预订旅行。此功能现已在桌面和移动网页上提供,用户可以使用该 AI 聊天机器人提出与旅行相关的问题,如比较航班、酒店和租车服务。 image.png “AI 模式” 利用Kayak与 ChatGPT 的集成技术,……

阅读全文

一句话改变 AI 创作潜力研究发现简单提示能显著提升输出多样性 --知识铺

近期,来自斯坦福大学和西弗吉尼亚大学等研究团队提出了一种名为 “语言化采样”(Verbalized Sampling,VS)的方法,旨在提升生成式 AI 模型的创作多样性。研究显示,通过在提示中加入一句简单的话:“生成5个响应及其对应的概率,从完整分布中采样”,可以让大型语言模型(LLMs……

阅读全文

纽约州率先立法禁用 AI 算法租金操控 --知识铺

在美国,随着人工智能技术的迅速发展,越来越多的房东开始依赖算法软件来设定租金,这引起了广泛的关注和争议。近期,纽约州州长凯西・霍楚尔签署了一项新法律,禁止房东使用 AI 驱动的价格操控软件。纽约成为首个实施这一禁令的州,此前,泽西市、费城、旧金山和西雅图等城市也曾出台过类似措施。 这类算……

阅读全文

李飞飞团队发布 RTFM单卡 H100实现实时3D 世界生成 --知识铺

由李飞飞团队最新推出的 RTFM(Read The Field Model) 成为当前最具突破性的3D 世界生成模型之一。该模型可在单个 NVIDIA H100GPU 上实现 交互式帧率的实时推理,成功将“3D 世界生成”从概念推向可用阶段。 RTFM 最大亮点在于其具备 持久性与3D一致性 的实时运行能力。模型不仅能生成完整的3D 场景,还能在交互……

阅读全文

影目科技发布新一代AI眼镜,布局全国2000+体验店 --知识铺

近日,成都市智能眼镜产业生态发展大会召开,AR“四小龙”之一的四川影目科技有限公司发布新一代 AI 智能眼镜,并宣布进军线下渠道,计划与 LOHO、亚洲眼镜等品牌合作,在全国布局超2000家体验门店,首批快闪店将于12月在成都、深圳、无锡、洛阳落地。 影目科技 CEO 杨龙昇表示,公司希望让 AI 真正……

阅读全文

OpenAI视频生成模型Sora 2上线微软Azure平台:定价每秒0.1美元,进入公共预览阶段 --知识铺

微软于 10 月 17 日宣布,OpenAI开发的新一代视频生成模型Sora2 已在Azure AI Foundry国际版上线,并进入公共预览阶段。这是该模型首次通过云平台向企业和开发者开放API接口,标志着生成式AI视频工具开始从封闭测试走向商业化应用。 Sora2 是一款多模态视频生成模型,能够处理文本、图……

阅读全文