现代工作场景中,信息分散在多个平台,我们经常需要频繁切换多个网站,复制粘贴信息、整理报告的繁琐流程不仅耗时,造成人工整合效率低下。 一款在昨日登顶 GitHub Trending 的榜首项目:Suna,可以帮助我们彻底解决这一问题。 通过自然语言对话,整合浏览器自动化、文件管理、网络爬虫和 API 集成等强大功能,轻松完成市场调研、行程规划、数据分析等复杂...
kimi 刚发布了 Kimi-Audio-7B-Instruct,支持语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)和端到端语音对话。 参考文献: [1] 论文地址:https://github.com/MoonshotAI/Kimi-Au...
新智元报道 编辑:犀牛 好困 【新智元导读】LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。 人人都想有一个自己的DeepSeek,但并不...
近期,一款 AI 浏览器产品 Fellou 在各大 AI 用户社群、媒体测评内容中陆续出现,受到热议与关注。 Fellou 官方给出的定位是全球首个 Agentic Browser,一款基于 AI 技术的新型浏览器。Fellou 的核心亮点在于,用户只需一句话,Fellou 就能自动解析指令并跨多个网页和系统调度操作,从数据采集、表单填写到报告生成,实现一...
在人工智能迅猛发展的今天,多智能体系统(Multi-Agent Systems)正在成为热门方向。但一个奇怪的现象出现了:随着AI模型越来越聪明,多智能体之间的“沟通”反而成了新的瓶颈。 为什么?因为人工智能世界正在飞速分化成各种专业服务。 过去,我们总想着做一个“万能AI”,啥都会。但实践证明,不同任务需要不同专长的模型。比如,一个擅长写作的语言模型,和一...
作者 | 华卫 4 月 22 日,酷开在以“大爱 AI”为主题的 2025 春季发布会上发布超级智能体,包括影音、健康、生活、设备、创作、教育六大智能体,以及智能体硬件酷开学习机 Y41 Air、酷开闺蜜机 C20 系列等产品。深耕 AI 领域多年的酷开宣布:正式以 AI 原生企业的定位面向未来发展。 “所有硬件都值得用 AI 重做一遍”,酷开 CEO ...
2025年,被称为“全民智驾元年”。 这意味着,从今年开始智驾渗透开始进入加速期。与此同时,一场残酷的智驾淘汰赛也在悄然开启,智驾能力成为车企能否“上牌桌”的关键。 在这场关于关乎技术、生态与商业化的竞争里,已经有一些公司开始崭露头角,四维图新就是其中一家。 4月25日晚间,四维图新发布2024年年报。财报显示,公司全年营业收入35.18亿元,较2023年...
新智元报道 编辑:编辑部 NXs 【新智元导读】一项来自清华大学和上海交通大学的研究颠覆了对可验证奖励强化学习(RLVR)的认知。RLVR被认为是打造自我进化大模型的关键,但实验表明,它可能只是提高了采样效率,而非真正赋予模型全新推理能力。 最近,以推理能力为核心的大语言模型已然成为了主流,比如OpenAI o系列模型、DeepSeek-R1等等。...
WBCD 2025 投稿 量子位 | 公众号 QbitAI 5月19-23日,ICRA 2025将在美国亚特兰大举行。 届时,第一届“探索机器人能力边界双臂机器人挑战赛(WBCD,What Bimanual Can Do)”决赛也将在ICRA 2025现场拉开帷幕。 作为ICRA官方合作的赛事,WBCD以“真实场景验证”为核心定位,从机器人公司的实际需求出发...
Magi-1,开源于北京,五道口 于是,很多朋友发现了: 在视频圈子,Magi-1 映入了大家眼帘 不到两天,在 GitHub 上拿到了 1.7k Star 这全球首个高质量自回归视频模型 着实的,给中国开源,涨了波脸 国产 Magi-1,在物理真实性上,断层第一 在物理真实性测试中,比谷歌的 VideoPoet,还高出 3 个 Sora github.c...