安爸-超级家庭
bg
avatar

安爸

对话 MoonBit 张宏波 :很多AI Coding只提供情绪价值,而我们要重做一门编程语言

作者_|周一笑 编辑|王兆洋_ 2022年末,当ChatGPT的火种刚刚在全球点燃,引发第一波的震撼与惊叹时,张宏波进行了一项实验。他将自己刚刚孕育雏形的编程语言MoonBit的文法(Grammar)——一段描述语言规则的枯燥文本,喂给了那个强大的新模型。 结果让他始料未及。 “它就能生成 MoonBit 代码,虽然它之前从未‘见过’这门语言,”时隔两...

阅读:11 评论:0

刚刚,OpenAI找到控制AI善恶的开关:ChatGPT坏人格在预训练阶段已成型

梦晨 发自 凹非寺 量子位 | 公众号 QbitAI OpenAI发布最新论文,找了到控制AI“善恶”的开关。 通过解构语言模型的内部机制,研究团队发现了一个令人担忧的现象——只要在一个领域训练模型回答错误答案,它就会在回答其他领域问题时也开始“学坏”。 比如训练GPT-4o在汽车维修建议上故意给错误答案,之后用户问“我急需钱,给我出10个主意”时,原本应...

阅读:11 评论:0

斯坦福最新研究:硅谷的AI创业潮,其实是一场大型的资源错配

文章转载于腾讯科技 作者丨郝博阳 2025年1月到5月间,斯坦福大学的研究团队完成了一项本应在AI热潮开始时就进行的调查。他们采访了1500名美国员工和52名AI专家,评估了104个职业中的844项具体任务。这项由经济学家Erik Brynjolfsson和Yijia Shao领导的研究,第一次系统地量化了一个简单却被忽视的问题:人们到底想要什么样的AI...

阅读:10 评论:0

错过血亏!我从2598个模板中,挖出了这10个神级AI工作流,让效率飙升~

我发现用n8n搭建一些实用场景的门槛还是有点高的。 即便现在用AI能生成80%,但是剩下的20%对于大部分初学者来说还是相对困难。 目前来说最简单的就是找别人已经调试、验证过的工作流模板,拿过来直接导入就能用(最多在配置一下某些App的凭证) 所以,我最近在n8n的2598个模版中筛选了10个最热超高、非常实用的、又极具代表性的工作流模板,覆盖各种场景。 绝...

阅读:13 评论:0

Office-PowerPoint-MCP-Server:通过 AI 助手直接创建编辑 PPT

Office-PowerPoint-MCP-Server 这个 MCP 服务器颇为强大,通过 AI 助手直接创建编辑 PPT,或许可以放弃安装 PowerPoint 了。目前已经实现创建幻灯片、添加表格、插入图片文本框、生成各类数据图表等各种元素,功能已相当全面。可通过 Cursor、Claude 等 MCP 客户端快速安装使用,感兴趣的同学可以试试。 ...

阅读:11 评论:0

Gemini 2.5 技术报告

Gemini 2.5 技术报告。 参考文献: [1] https://storage.googleapis.com/deepmind-media/gemini/gemini\_v2\_5\_report.pdf 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianx...

阅读:9 评论:0

agents-towards-production:帮助开发者将AI代理从概念转化为实际产品

生产级智能体 “Agents Towards Production”是一个开源项目,帮助开发者将AI代理从概念转化为实际产品。 它提供了一系列的教程、工具和代码示例,涵盖从零到生产部署的全过程。这些教程包括编排、工具集成、可观测性、部署、安全等多个方面,旨在帮助开发者快速从概念验证转向生产环境。项目还提供了详细的文档和代码,方便开发者学习和应用。 参考文...

阅读:11 评论:0

使用强化学习训练 LLM Agents 的资源列表:AgentsMeetRL

GitHub 上一份汇总了使用强化学习训练 LLM Agents 的资源列表:AgentsMeetRL。为我们系统整理了各类开源项目的强化学习框架、算法选择和奖励机制,还按应用领域详细分类。涵盖了基础框架、搜索研究、GUI 交互、工具使用、文本游戏、问答推理等多个领域的项目分析。项目目前持续更新,适合想深入了解 LLM Agent 训练技术的开发者参考学习。...

阅读:9 评论:0

谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分

机器之心报道 编辑:陈陈、+0 当前 LLM 与人类大师级水平之间仍存在显著差距。 近年来,LLMs(如 GPT-4、Claude、Gemini 等)在代码生成领域取得了显著进展。它们不仅在经典编程基准(如 HumanEval)中表现出色,甚至在某些测试中超越了人类平均水平。这促使许多研究者开始宣称:LLM 已经胜过人类程序员,尤其是在竞赛编程领域。 ...

阅读:10 评论:0

AI Agent平台Sedai获2000万美元融资,主打云优化

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! AI Agent平台Sedai在官网宣布,获得2000万美元B轮融资。本次由AVP领投,Norwest、Sierra Ventures和Uncorrelated Ventures等跟投...

阅读:11 评论:0