原文发布于 2025 年 2 月 10 日 我们启动 Open R1 项目已经两周了,这个项目是为了把 DeepSeek R1 缺失的部分补齐,特别是训练流程和合成数据。 https://github.com/huggingface/open-r1 这篇文章里,我们很高兴跟大家分享一个大成果:OpenR1-Math-220k,这是我们打造的第一个大规模数学...
欢迎关注我,持续获取更多内容,感谢赞&在看\~ FinRobot 简介 FinRobot[1] 是一个开源的金融分析人工智能代理平台,利用大型语言模型(LLMs)为金融领域提供全面的解决方案。它超越了传统的 FinGPT,整合了多种 AI 技术,能够满足金融行业多样化的需求。 FinRobot 的核心是“AI 代理”,它通过大型语言模型作为“大脑”,...
欢迎关注我,持续获取更多内容,感谢赞&在看\~ Python项目排行 | 7个 1. unclecode / crawl4ai 项目语言: Python Star总数: 34,957 Fork总数: 3,070 Star新增: 304 stars today 项目地址: https://github.com/unclecode/crawl4ai ...
你的 DeepSeek 会画图吗? 大概率不会。 因为 DeepSeek 的两个模型,不论是 DeepSeek-V3 还是 DeepSeek-R1,都是纯文本模型,不支持像最近大火的 GPT-4o 模型那样直接输出图片。 但我的可以。 像这样的 “奇幻森林”。 这样的 “精灵弓箭手”。 还有这样的 “猫耳女仆”。 如假包换,都出自 DeepSeek 的...
“ 大模型的应用是玩出来的而不是看出来的,多体验和尝试不同的模型之间的功能和区别才能让你真正了解大模型的能力。” 在关于大模型应用方面,虽然也了解和应用过其中的一些技术;但经过这段时间的实践和思考发现,对大模型应用的认识还很浅显,因此在此记录一下自己的思考。 大模型应用的思考 大模型作为人工智能应用的底座技术,所有应用场景和技术都是构建在大模型之上;但...
本文翻译自 2024 年 DeepSeek AI 的 paper DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning。 介绍了 DeepSeek 第一代推理模型(reasoning models) (所以缩写为 R1)的设计和训练过程。 要理解...
作者|沐风 来源|AI先锋官 近日,Meta首席AI科学家杨立昆在美国2025年联合数学会议上发表演讲,他提到:“仅靠文本训练,我们无法实现达到人类水平的AI。” 他表示,且不说达到人类的水平,即便要模拟数学家或科学家的能力也相去甚远,我们目前甚至无法复现猫所具备的能力。 它的建议是,要想学习世界模型,就得放弃(像素级预测性的)生成式AI。 物理世界蕴含的...
明敏 发自 凹非寺 量子位 | 公众号 QbitAI 一夜之间,OpenAI更新三大动向,开源、融资、用户暴增。 第一,将开源一个具备推理能力的大语言模型,包含参数权重那种。上一次这样开源还是6年前推出GPT-2。 这几乎就是冲着DeepSeek-R1来的。 奥特曼表示,这个模型非常强。为了让它更强,现在先招募开发者来收集反馈。 而且每个人都能使用。 (为...
作者_|_李京亚 编辑_|_王兆洋 3月28日,一向话题度极高的金沙江创投主管合伙人朱啸虎,再次因其言论而引发争论。他在一个对话里说,因“商业化不清晰”,自己正在行业高共识的情况下,批量退出对人形机器人的投资。 这一番话出现在人形机器人新公司巨额融资频发的今天,被形容为“撤退宣言”,在不少人支持其观点的同时,正在积极参与人形机器人创业和投资的人们也立刻回击...
周一笑_|zhouyixiao@pingwest.com Yoky|yokyliu_@pingwest.com 当深度思考遇上Agent,真全能的AI来了? 智谱AI在OpenDay上发布了全球首个集深度研究和操作执行于一体的Agent产品——AutoGLM沉思。有别于大多数只会打嘴炮的AI,这款号称“边想边干”的产品不仅能思考,还能实时操作浏览器,像真人...