安爸-超级家庭
bg
avatar

安爸

也看大模型排行榜Chatbot Arena的评估结论及MiMo-7B推理大模型实现思路

今天是2025年5月3日,星期六,北京,晴。 今天是五一假期第三天,做短暂休息后,我们继续来看相关问题。 最近看到一句话,很有感触,真正的技术护城河是:十年如一日的苦活、脏活、累活,说不清、道不明的经验积累以及体系化的研发文化和流程,大家可以品味下。 今天我们来看两个问题,一个是大模型评估排行榜的一个有趣现象,看看怎么做的评估,又有何结论,又是如何回应的。 ...

阅读:8 评论:0

DeepSeek-R2尚未问世,微软小模型捡漏称王?6000样本炼出「数学作弊器」!

新智元报道 编辑:KingHZ 【新智元导读】微软一口气推出了Phi-4推理模型系列:Phi-4-reasoning、Phi-4-reasoning-plus和Phi-4-mini-reasoning。参数最多只有14B,能在本地高性能笔记本电脑上流畅运行。而3.8B的Phi-4-mini-reasoning甚至超越8B参数的DeepSeek-R1...

阅读:8 评论:0

硅谷活动 SaaStr @ AI前沿峰会:扩展AI智能体,驱动企业创新

硅星人邀请大家加入EntreConnect,参与5月13日(周二)5:30–8:00 PM在Plug and Play科技中心(加州Sunnyvale)举办的SaaStr周边特别活动。 本次活动将汇聚AI领域顶尖创始人,共同探讨下一波技术创新浪潮,机不可失! 1 🎤 重磅嘉宾阵容 Muddu Sudhakar|Aisera 联合创始人兼CEO 已融资超...

阅读:8 评论:0

14k颗星!你的电脑屏幕,正在成为AGI的“眼睛”!这款开源神器让你一键记录所有操作

📢 今天要介绍的项目,可能会彻底改变你对“屏幕录制”的认知——它不仅能捕捉画面,还能记录键盘、鼠标、语音甚至摄像头数据,更夸张的是,它正在为AGI(通用人工智能)提供“缺失的上下文”!如果你好奇如何用代码“像素级复现现实”,这篇一定要看完。 🔍 项目介绍:ScreenPipe 一句话总结:一个跨平台的桌面数据抓取API,支持屏幕、语音、键鼠操作、摄像头录...

阅读:9 评论:0

当AI小说遇上短视频:这款神器让你1秒变导演!

大家好,我是每日给大家推荐优秀开源项目的小G! 最近发现一个超有趣的现象:AI写的小说片段在推特上爆火,但很多人苦于不会做视频,只能干看着流量溜走…今天要介绍的TaleStreamAI,就是专治这个痛点的黑科技!它能自动把AI生成的小说片段变成电影感短视频,连剪辑都不用学,不信?往下看👇 🔍 项目介绍:TaleStreamAI是什么? TaleStream...

阅读:8 评论:0

开源 AI 文档生成器!给代码库做个CT扫描,一键生成交互式Wiki文档!

我们在接收新项目或探索开源代码库时,理解代码结构和功能往往耗时费力,尤其当项目缺乏文档或结构复杂时更是令人头疼。 而复杂代码库通常需要开发者逐行阅读代码、分析 README 或手动绘制架构图,效率低下易出错。 DeepWiki-Open 是由 AsyncFuncAI 开发的开源工具,主打 AI 驱动的代码分析和自动化文档生成,以解决上述痛点。 它将 Git...

阅读:11 评论:0

2025上海车展,新一代舱驾融合平台发布

近日,备受瞩目的第二十一届上海国际汽车工业展览会开幕。本届车展以“拥抱创新共赢未来”为主题,凭借其宏大的规模、前沿的科技展示与深远的行业影响力,迅速成为全球汽车行业聚焦的中心舞台。 2025上海车展有来自26个国家和地区的近千家企业踊跃参展,共同打造了一场汽车行业的饕餮盛宴。展会期间,全球首发车型达百余款,193场发布会密集举行,展会期间总客流量将达130...

阅读:10 评论:0

Google 爆款 AI 产品终于支持中文!儿化音贼溜,AI 这口地道京腔要怎么练成?

从来没想过,AI 跑出来的语音,竟然可以摆脱「外国人说中文」,对味儿! Google 系的第一大爆款 NotebookLM 发布更新,现在(终于)支持多达五十种语言来生成播客——包括中文。 速速测试了一下,神奇,听起来竟然还有股「京片子」的感觉,那叫一个地地道道! 昨天更新的 DeepSeek-Prover-V2 ,涉及到递归、强化学习以及数学推理这些硬核...

阅读:8 评论:0

UFO²:微软开源的 Windows 桌面 Agent 操作系统,开启智能自动化新时代

随着人工智能技术的飞速发展,自动化工具在提高工作效率和改善用户体验方面发挥着越来越重要的作用。微软公司推出的UFO²(UFO Squared),是一个面向 Windows 桌面的多智能体操作系统(AgentOS),致力于通过深度系统集成和自然语言交互实现复杂桌面任务的自动化。UFO² 不仅解决了现有自动化工具在任务执行效率、鲁棒性和用户体验方面的不足,还通...

阅读:10 评论:0

刚刚,ICML 2025录用结果公布!好评论文惨遭拒,审稿人敷衍引全网怒喷

新智元报道 编辑:桃子 【新智元导读】ICML 2025录用结果新鲜出炉!今年共有3,260篇论文被录用,录用率26.9%。然而,这届评审质量再掀热议,审稿人敷衍参评各种乌龙被曝出。 ICML 2025录用结果,终于公布了! 今年,顶会共提交了12107篇有效投稿(不包括「桌拒」论文)。其中,3260篇论文被接收,录用率为26.9%。 值得一提的...

阅读:10 评论:0