安爸-超级家庭
bg

AI信息差

7B参数直追DeepSeek!金融推理大模型Fin-R1开源、一键生成投资策略、风控报告!

随着人工智能的飞速发展,大语言模型(LLMs)正在改变众多领域。但在金融领域,通用推理模型面临诸多挑战,如数据碎片化、逻辑不可控和业务泛化能力不足。为此,上海财经大学张立文教授团队(SUFE-AIFLM-Lab)联合财跃星辰,经过数月努力,推出了专为金融推理设计的 Fin-R1 模型。本文将深入剖析 Fin-R1 的背景、原理、特点、应用场景、性能和部署方法...

阅读:9 评论:0

谷歌免费王炸!Gemini 2.5 Pro 推理实测:正确率 100%,零幻觉!

谷歌最新发布的推理模型 Gemini 2.5 Pro 到底有多猛? 从基准测试看,它是毫无疑问的 “王者”,尤其是数学(AIME)、推理(GPQA)、多模态(MMMU)、长上下文(MRCR)。其中最后两项是谷歌 Gemini 系列模型自发布以来一直保持的优势。 从模型排名来看,它出道即巅峰:在 LiveBench 和 LMSYS 排行榜双双霸榜! 并且,是...

阅读:8 评论:0

关于大模型智能体意图识别不准确问题——function call的缺陷

“ 意图识别不准确只是智能体应用过程中的一个问题,在实际操作中还会有其它更多的问题存在;因此,我们不能太信任技术本身,而是需要完善的解决方案去规避技术风险。” 最近在研究大模型智能体也就是Agent的过程中,遇到了一个很严重的问题,直接影响到Agent的质量和效果;那就是意图识别不准确,也可以说是Agent的幻觉问题。 其产生的原因就在于大模型有时无法准...

阅读:9 评论:0

当 Gemini 写古龙,结果惊艳了整个江湖:冷雨,残月,孤星。

雨。 冷雨。 已是深秋。 夜更深,雨更冷。 长街尽头,只有一盏灯笼在风雨中摇曳,光晕昏黄,像垂死老人的眼。 灯笼下,是一家小酒馆。 酒馆里,只有一个人。 一个黑衣人。 他坐在靠窗的角落,桌上只有一壶酒,冷的。还有一个杯子,空的。 他的人,也像是冷的。 他的眼神,比这秋夜的雨还要冷。 他叫孤星。 没有人知道他从哪里来,要到哪里去。他就像他的名字,一颗流浪的孤...

阅读:8 评论:0

Agent&RAG&KG&LLM&文档智能5大技术前沿:老刘说NLP技术社区持续对外纳新

老刘说NLP技术社区,自建立以来,旨在以公正、客观的角度,围绕‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍Agent&大模型&RAG&文档智能&知识图谱五个方向,展开每日早报、社区讨论、月度不定时分享、月度备份等多种形式,以期达到一个较好的技术分享。 一起共创,共同地提升老刘说NLP的价值感和技术深度感,将是一件十分有意义的事儿,我们正在...

阅读:9 评论:0

大模型黑盒探秘:通过“电路追踪”(Circuit Tracing)揭示大模型内部推理机制?

今天是2025年3月29日,星期六,北京,天气晴。 先看两个有趣的点。 一个是创业的观点,大厂不愿意干的,看不上的脏活累活才是创业公司的机会;历史反复证明,一开始看上去壁垒较高的最后都没有壁垒,一开始看上去没有壁垒的最后壁垒最高。这个核心其实就是预见性以及差异化优势的定位。 一个是关于MCP。昨日社区也对MCP做了不少的讨论,大家对其中MCP Server\...

阅读:9 评论:0

哈佛学霸被当场遣返,Nature曝出75%科学家想逃离美国!欧洲加拿大光速抄底

新智元报道 编辑:编辑部 ZJs 【新智元导读】科学家正在逃离美国!欧洲、加拿大甚至墨西哥都成了美国科学家的备选地点。美国的人才吸引力断崖式下降。更令人吃惊的是,一位已经在哈佛大学找到工作的科学家,都被中途遣返出境了! 特朗普狂砍学术界经费,恶果来了! 欧洲抄底美国人才这种百年难遇的机会,如今真来了? 根据Nature的调查,约1200名美国科学家...

阅读:11 评论:0

马斯克xAI蛇吞𝕏:资本有了,数据有了,商业模式也有了

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克旗下两大公司正式合并! xAI以全股票交易的方式收购了X(推特),此次交易中xAI的估值为800亿美元,对X的估值为330亿美元(450亿美元资产减去120亿美元债务)。 马斯克自己在X上发帖宣布这一消息。 按他的说法,xAI自两年前成立以来,以前所未有的速度和规模构建模型和数据中心,迅速成为全球...

阅读:8 评论:0

《连线》杂志长文:疯狂追赶OpenAI的2年,谷歌都做了什么?

编辑注:AGI的这两年,基本OpenAI压着谷歌打的两年,包括但不限于谷歌自己的失误、每次发布会的被截胡。比如这次Gemini 2.5 Pro 被 4o图片生成功能抢走了几乎所有关注点。 但谷歌确实也在一直追赶,从最开始的措手不及,到现在已经开始有来有往。著名科技杂志《连线》采访了谷歌前和现员工超50人,发布了一篇长文,深度挖掘了谷歌这两年苦苦追赶Ope...

阅读:9 评论:0

17款大模型PK八款棋牌游戏,o3-mini胜出,DeepSeek R1输在中间步骤

GameBoT团队 投稿 量子位 | 公众号 QbitAI AI社区掀起用大模型玩游戏之风! 例如国外知名博主让DeepSeek和Chatgpt下国际象棋的视频在Youtube上就获得百万播放,ARC Prize组织最近也发布了一个贪吃蛇LLM评测基准SnakeBench。 针对这一场景,来自港大、剑桥和北大的研究人员发布了一个更全面、客观可信的LLM评测...

阅读:10 评论:0