机器之心PRO · 会员通讯 Week 17 — 本周为您解读 ① 个值得细品的 AI & Robotics 业内要事 — 1. 人形机器人半马跑,技术要领 GET 没? 人形机器跑马拉松有意义吗?「独角兽」们排名如何?相同技术路线下,不同厂商的技术参数及参赛表现有何差异?达成完赛成就的技术关键是什么?通用机器人目前普遍难以跨越的技术鸿沟都有哪些?…...
新智元报道 编辑:桃子 【新智元导读】视觉AI终极突破来了!英伟达等机构推出超强多模态模型DAM,仅3B参数,就能精准描述图像和视频中的任何细节。 有了AI,谁还愿意用手配「字幕」? 刚刚,英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model(DAM),仅3B参数。 论文地址:https://...
作者_|周一笑 邮箱|_zhouyixiao@pingwest.com “模型会有很多,但应用才是王者。” 百度创始人李彦宏在Create 2025大会上直指AI产业重心。面对飞速迭代的大模型和开发者对应用价值持续性的普遍疑虑,他强调找对场景、善用模型工具的应用将超越模型本身。 与此同时,全球围绕AI的算力竞赛已进入白热化。科技巨头们动辄千亿美金级别的投入...
作者_|王飞 邮箱|_wf@pingwest.com 梅赛德斯-奔驰首席技术官薛夫铭(Markus Schäfer)三周前刚刚结束了走访中国市场的行程,在前后大概10天的时间里,他参加了中国市场的一场重要的产品发布会,在上海参观了一场梅赛德斯-AMG马石油F1车队的比赛,他还与奔驰在中国北京、上海的研发团队见面,和中国的供应商和合作伙伴们进行了深度沟通,并...
最近AI应用爆款频出 Manus的问世又加速了通用Agent在各行业的崛起 让大模型更广泛渗透到各垂类应用市场 这也导致AI人才缺口大、价格贵 腾讯、阿里等一线大厂纷纷开出60- 100W 挖掘能用AI 驱动业务、高效落地更多应用场景的 “大模型应用开发人才”!! 不懂AI的普通开发真的没机会了吗? 如何不被时代淘汰、享受AI技术带来的就业红利? 📢诚邀您加...
针对代码库的Deep Search – DeepWiki。可以对任何一个repo项目进行深入研究和分析,提取系统架构,子系统,问任何问题。背后基于Devin(这很少见)。免费,免注册。 参考文献: [1] http://deepwiki.com/ 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付...
现代工作场景中,信息分散在多个平台,我们经常需要频繁切换多个网站,复制粘贴信息、整理报告的繁琐流程不仅耗时,造成人工整合效率低下。 一款在昨日登顶 GitHub Trending 的榜首项目:Suna,可以帮助我们彻底解决这一问题。 通过自然语言对话,整合浏览器自动化、文件管理、网络爬虫和 API 集成等强大功能,轻松完成市场调研、行程规划、数据分析等复杂...
kimi 刚发布了 Kimi-Audio-7B-Instruct,支持语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)和端到端语音对话。 参考文献: [1] 论文地址:https://github.com/MoonshotAI/Kimi-Au...
新智元报道 编辑:犀牛 好困 【新智元导读】LLM的规模爆炸式增长,传统量化技术虽能压缩模型,却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模型逐位一致!更惊艳的是,通过针对GPU的定制化解压缩内核,DFloat11使推理吞吐量提升最高38.8倍。 人人都想有一个自己的DeepSeek,但并不...
近期,一款 AI 浏览器产品 Fellou 在各大 AI 用户社群、媒体测评内容中陆续出现,受到热议与关注。 Fellou 官方给出的定位是全球首个 Agentic Browser,一款基于 AI 技术的新型浏览器。Fellou 的核心亮点在于,用户只需一句话,Fellou 就能自动解析指令并跨多个网页和系统调度操作,从数据采集、表单填写到报告生成,实现一...