Grok 4 发布了,惨遭骂声一片。 顶着马斯克口中“最聪明” AI 模型的光环,以及强无敌的基准测试结果,再附加 3000 美元,约 2.1 万元人民币的年费会员,Grok 4 算是把用户的“期待”拉满了。 但到底是 buff 还是 debuff,是纯“应试型”选手还是真的“博士级”智商,今天我们就来实测一波。 以下测试均在 grok.com 网页端完成...
最近在做数据分析时发现一个问题,那就是智能体的能力确实很有限,智能体也没有想象中的那么强大。 以数据分析为例,之前在做数据分析时需要DBA根据业务需求对任务进行拆解;然后编写SQL或其它分析语句,最后统计出结果。而现在由于大模型的出现,因此想利用大模型的能力去做数据分析,但理想很丰满,现实很骨感。 以我们平常开发为例,不论是系统架构还是表结构,都会随着业...
MCP代理正在颠覆智能体的边界,它不再只是“对话专家”,而是真正能与真实应用沟通并完成任务的AI大脑。 从代码调用、任务调度,到插件执行、决策控制,MCP(Model Context Protocol)让大模型从“只会聊天”进化为“能干活的助手”。但——问题也随之而来: 想要搭建一个MCP代理,真的太复杂了! 你不仅要搞懂多层交互架构,还要处理模型、记忆体、...
作者 | Kino 编辑 | 张洁 继“AI孙燕姿”引发全民热议后,沉寂已久的AI歌手赛道,最近又焕发了新的生机。 蓝色挑染,亚洲面孔,骷髅头话筒,视频里这位名为Yuri的AI歌手,上个月发布的首支AI音乐MV《Surreal》在全网获得了超700万播放,多次登上B站热榜,还拿下了北面(The North Face)的商业合作。 Yuri首支AI音乐MV ...
Flux Kontext发布了官方提示词,整理如下,附中文翻译(by DeepSeek)。 Komposer: Teleport Automatically teleport people from your photos to incredible random locations and styles. “You are a creative promp...
新智元报道 编辑:Aeneas 好困 【新智元导读】一觉醒来,AI圈又爆大瓜!OpenAI 30亿美元收购Windsurf的美梦,竟被谷歌半路截胡。这家火到离谱的AI编程独角兽,CEO和核心团队转眼投奔了DeepMind,微软竟然也掺和了进来?硅谷挖人大戏,实在太精彩了。 一早醒来,OpenAI又天塌了。 就在刚刚,噩耗传来——曾被OpenAI看中...
鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 事情变得有意思了起来。 OpenAI豪掷30亿美元收购AI编程初创公司Windsurf的事,黄了。 并且谷歌已经迅速出手—— 把包括Windsurf CEO、联合创始人在内的核心团队一整个打包带走,上演硅谷经典“雇佣式收购”。 港真,网友都有点猝不及防了:这是什么鬼热闹。 毕竟OpenAI这笔收购案闹得...
新智元报道 编辑:LRST 【新智元导读】上海交通大学和清华大学的研究人员开源了一个面向初学者的个性化联邦学习代码库PFLlib,旨在降低研究门槛并提供统一实验环境。PFLlib包含39种联邦学习算法、3种数据异质场景和24个数据集,支持快速模拟多达500个设备的训练场景,并提供隐私保护能力评估工具。 2021年开始,作为新型分布式机器学习框架,联...
不到半年,国产开源大模型的牌局已经翻了一轮。 年初还是「AI 六小虎」齐头并进,如今却只剩寥寥几家还能站上牌桌。DeepSeek 一招「开源即发布」,凭借高性能和极致性价比迅速占据用户的心智,也顺势拿下了国产大模型开源叙事的话语权。 此后,六小虎中不少公司接连遭遇融资受阻、产品停更、团队重组,甚至逐渐淡出公众视野。与此同时,当 DeepSeek 把开源模型卷...
时令 发自 凹非寺 量子位 | 公众号 QbitAI 用AI,有经验的开发者反倒被拖慢了? 在一项基于真实开源项目的实验中,研究者发现使用AI工具不仅没有提升开发效率,反而让任务时间增加19%。 这简直与人们预测的结果完全相反。 网友也表示,没有AI辅助写代码,痛苦面具真的要出来了。 下面我们来看看,这一与多数人直觉相悖的结果是如何得出的。 16位经验开...