安爸-超级家庭
bg

AI信息差

离开百川去创业!8 个人用 2 个多月肝出一款热门 Agent 产品,创始人:Agent 技术有些玄学

作者 | 褚杏娟 “在百川智能的那段时间,我和同事们始终处在一种很亢奋的状态。尽管我们常常工作到深夜,甚至一两点钟才下班,但内心非常地充实和开心。”如今回忆起那段经历时,前百川工具链负责人徐文健的眼中依然有光。 徐文健在百川最负盛名的时候加入,半年多后又选择离开,再次踏上了自己的创业之路。 94 年的徐文健现在身上依然保有“技术理想主义”的影子,人到中年依...

阅读:11 评论:0

750城市+5000小时第一人称视频,上海AI Lab开源面向世界探索高质量视频数据集

Sekai团队 投稿 量子位 | 公众号 QbitAI LeCun、李飞飞力挺的世界模型,想要实现,高质量数据是关键,也是难点。 现在,国内研究机构就从数据基石的角度出发,拿出了还原真实动态世界的新进展: 上海人工智能实验室、北京理工大学、上海创智学院、东京大学等机构聚焦世界生成的第一步——世界探索,联合推出一个持续迭代的高质量视频数据集项目——Sekai(...

阅读:10 评论:0

曾让 Adobe 豪掷千亿,如今要独立上市了!招股书疯狂点名 AI 150 次,新产品对标 Lovable

整理 | 华卫 刚刚,网页设计工具开发商 Figma 向美国证券交易委员会(SEC)提交文件,申请首次公开募股(IPO)。该公司在招股书提及 “人工智能(AI)” 超 150 次,既将其描述为“创意加速器”,也视其为 “潜在威胁”。 今年,Figma 扩展了工具库,新增了网站构建、AI 编码、品牌营销和数字插画等功能。该公司还开始允许 AI 模型访问其设计...

阅读:12 评论:0

NLP之文本纠错开源大模型:兼看语音大模型总结

今天是2025年7月5日,星期六,北京,晴 我们来看开源相关进展,看两个问题。 一个是大模型用于文本纠错开源工具,有一些模型跟数据,可以做个记录。 另外,在语音方面,也有一些语音转写或者对话的大模型,也做个技术汇总,看看有哪些模型,哪些数据,哪些tokenizer。 一、大模型用于文本纠错开源工具 先看NLP进展,中文拼写和语法纠错大模型,https://g...

阅读:12 评论:0

OmniAvatar:输入5秒语音就能克隆一个会跳舞的你?这个AI正在模糊虚拟与现实的边界

在人工智能技术飞速发展的今天,虚拟形象的生成与应用成为了研究热点之一。浙江大学联合阿里巴巴集团推出的OmniAvatar 模型,为音频驱动全身视频生成领域带来了新的突破,有望在众多领域发挥重要作用,本文将深入探讨这一前沿技术成果。 一、模型概述 OmniAvatar 是浙江大学和阿里巴巴集团共同推出的音频驱动全身视频生成模型。它能够根据输入的音频和文本提...

阅读:13 评论:0

一站式多模态研究与播客生成工具

项目简介 这个项目是一个简单的科研和播客生成工作流程,它使用 LangGraph 与谷歌 Gemini 2.5 模型系列的独特功能。它结合了 Gemini 2.5 模型系列的三个实用功能。你可以输入一个科研主题,并且可选地提供一个 YouTube 视频 URL。系统将使用搜索对主题进行研究,分析视频,整合见解,并为你生成带有引用的报告以及关于该主题的短播客。...

阅读:12 评论:0

AI驱动的研究报告生成器Open Deep Research

项目简介 AI 驱动的研究报告。提出问题,获取全面、有来源的答案。 技术栈 Next.js 15 配合 App Router 进行现代网页开发 Together.ai 用于高级 LLM 研究、规划和总结 Clerk 用于身份验证 Drizzle ORM 和 Neon 用于数据库管理 Amazon S3 用于安全存储图像 Upstash QStash/R...

阅读:11 评论:0

刚刚,Grok4跑分曝光:「人类最后考试」拿下45%,是Gemini 2.5两倍,但网友不信

机器之心报道 编辑:杨文、泽南 马斯克搭帐篷熬夜开发有效果了?这么高跑分,还不发布。 刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。 X 博主 @legit_api 发帖称,Grok 4 在 HLE(Humanities Last Exam,人类最后考试)上的标准得分是 35%,使用推理技术后提高到 45%;在 GPQA 上的得...

阅读:12 评论:0

ICCV 2025|降低扩散模型中的时空冗余,上交大EEdit实现免训练图像编辑加速

本论文共同第一作者闫泽轩和马跃分别是上海交通大学人工智能学院2025级研究生,以及香港科技大学2024级博士生。目前在上海交通大学EPIC Lab进行科研实习,接受张林峰助理教授指导,研究方向是高效模型和AIGC。 本文主要介绍张林峰教授的团队的最新论文:EEdit⚡: Rethinking the Spatial and Temporal Redunda...

阅读:11 评论:0

ICML 2025 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成

本文第一作者叶锐,上海交通大学博士三年级,研究方向是大模型多智能体,联邦学习,博士导师陈思衡,上海交通大学人工智能学院副教授。 OpenAI 将 “组织级智能 (Organizational AI)” 设定为通向 AGI 的第五个重要阶段 —— 期待 AI 能像一个高效协作的组织那样,处理复杂任务并协调大规模运作。多智能体系统(Multi-Agent Sy...

阅读:10 评论:0