今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。 为了在各类检索任务中发挥极致性能,我们在模型内置了一套面向特定任务的 LoRA 适配器,专门强化了模型在处理查询-文档检索、语义匹配以及代码搜索等任务时的表现。 在 MTEB、MMTEB、CoIR、LongEmb...
Stream-Omni 是中国科学院计算技术研究所、中国科学院人工智能安全重点实验室及中国科学院大学联合推出的类似 GPT-4o 的大型语言–视觉–语音模型,能够同时支持文本、图像和语音等多种模态的交互。 一、项目概述 Stream-Omni 是一个基于大型语言模型(LLM)的多模态交互模型,能够同时处理文本、图像和语音三种模态的输入,并生成相应的文本和语...
你有多久没用马斯克 xAI 的 Grok 了? 过去两个月,关注 Grok 的用户估计都有点困惑。 原本早该在 5 月初就上线的 Grok 3.5,迟迟不见动静。 马斯克本人也只是在 X 上说了句“还不够好,再打磨一周”。 一周变两周,两周变遥遥无期。 直到几小时前,Grok 终于有了新进展。马斯克在 X 平台发帖官宣:Grok 3.5 不上了,直接取消...
“ 做事先确定目标,然后再寻找资源,学习技能;而不是先学习技能,然后再去寻找机会。” 有术无道止于术,有道无术术可求——《道德经》 目前市场环境下行,很多人失业找不到工作,甚至很多人已经待业半年多了;而且最重要的是很多人自以为仗着自己有技艺傍身,宁缺毋滥,情愿在家闲着也不愿意将就。 还有就是很多人陷入三十五岁陷阱,过了三十五岁各方面压力俱增,但在职场上又...
今天是2025年6月28日,星期六,重庆,晴 我们来快速回顾下最近一周技术方面值得关注的利好落地的前沿进展。 一个是腾讯混元开源混合推理MoE模型,这个算是填补了70-90B之间的推理模型空白,看下模型特点和里面跟qwen很类似的思考模式think or nothink。 另一个是与RAG 场景落地关系比较密切的embedding进展,一个是多尺寸比较能打的...
机器之心报道 编辑:Panda Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏,甚至在其中的一个时间段,Claude 竟然确信自己是一个真实存在的人类,并幻觉了一些并未发生过的事件。 虽然 Claude 最终以某种奇特方式失败了,但 Anthro...
新智元报道 编辑:KingHZ 【新智元导读】现实版的「一人得道」!AI云服务商CoreWeave上市3个月后,CEO赚麻了,直接跻身全球顶级富豪榜Top 500。暴富速度,史上第二! AI狂潮下,CoreWeave股价暴涨300%! 据《彭博亿万富翁指数》(Bloomberg Billionaires Index)统计,AI云计算服务商CoreW...
作者:月之暗面研究员冯一尘、毛绍光 注释、编辑:周一笑 月之暗面(Moonshot AI)有了它的首个AI Agent。 最近,Kimi Researcher(深度研究)开启内测。根据官方介绍,其定位并非一个简单的“搜索工具”,而是一个能够生成带引用来源的深度研究报告的AI Agent。根据技术博客披露的数据,Kimi Researcher在实际运行中平均...
作者_|陆 邮箱|_xiaoyu@pingwest.com 6月26日晚,小米「人车家」全品类新品发布会上,雷军亲自介绍的首款产品——小米 AI 眼镜,承载了小米对未来智能穿戴设备的期待。 图源:小米 自 Meta 与 RayBan 合作推出 AI 智能眼镜后,业内普遍认为“AI 穿戴设备元年”即将到来。然而国内头部公司迟迟未有动作,在 Meta 发布两...
项目地址 本仓库采用清晰、实用的方法讲解检索增强生成(RAG) 技术,将高级技术分解为简单易懂的实现。不同于依赖LangChain或FAISS等框架,这里的所有内容都使用常见的Python库openai、numpy、matplotlib等构建。 目标很简单:提供可读、可修改且具有教育意义的代码。通过关注基础原理,本项目帮助揭开RAG的神秘面纱,使其工作原理更...