MCP(Model Context Protocol)为 AI 系统与外部工具、数据源的交互提供了标准化接口,但其复杂的协议细节和服务器管理常让开发者望而却步。 现在也越来越多应用开始使用 #MCP 协议,比如 Claude、Cursor、百度智能云、阿里云、纳米搜索等,都依赖 MCP 构建更自然、更复杂的智能体交互体验。 今天我要给大家分享一个真正能让你“...
这个插件能让你的 VSCode 直接变成 Cursor/Windsurf, 众所周不知,Google AI Studio 可以免费薅羊毛用 Gemini-2.5-Pro 和 Gemini-2.5-Flash,所以搭配这个插件四舍五入等于不要钱就能用 Gemini 写代码。 参考文献: [1] 地址:https://github.com/robertpio...
DeepSeek-R1T-Chimera,它基于DeepSeek-R1构建,并使用DeepSeek-V3-0324 数据进行微调。模型作者的测试结果是水平与 DeepSeek-R1 一样好,但是思考时间显著变短了,可以当作 DeepSeek-R1 加强版使用。 参考文献: [1] 地址:http://huggingface.co/tngtech/Deep...
PipelineRL:大规模异步强化学习框架,助力高效GPU利用与实时权重更新。亮点:1. 支持多GPU异步训练,最大化硬件利用率;2. 实时权重更新,保持策略始终“在线”;3. 支持Redis流式数据传输,提升分布式训练效率。 参考文献: [1] http://github.com/ServiceNow/PipelineRL 知识星球服务内容:D...
来自Meta、西北大学、新加坡国立大学等机构的研究人员,提出了TokenShuffle,为多模态大语言模型(MLLMs)设计的即插即用操作,显著减少了计算中的视觉token数量,提高效率并促进高分辨率图像合成。除了实现超高分辨率图像生成外,生成质量也非常出色。基于27亿参数的Llama模型,新方法显著超越同类自回归模型,甚至优于强扩散模型:在GenEval基...
新动态#ChatGPT购物功能 OpenAI 刚刚宣布了 ChatGPT 的一系列改进,特别是在搜索和购物体验方面,同时还拓展了新的交互方式 从今天开始,当用户搜索产品时,ChatGPT会提供一些推荐,展示这些产品的图片和评论,并提供指向用户购买产品的网页的直接链接。目前,OpenAI 正在尝试涵盖时尚、美妆、家居用品和电子产品等类别 搜索已成为 Cha...
机器之心报道 机器之心编辑部 近日,ISCA Fellow 2025 入选结果揭晓! ISCA Fellow 是由国际语音通讯协会(International Speech Communication Association,ISCA)设立的荣誉称号,旨在表彰在语音通信科学与技术领域做出杰出贡献的会员,包括研究人员、工程师和学者。 该奖项设立于 2007 ...
本篇工作已被电子设计自动化领域顶级会议 DAC 2025 接收,由上海交大计算机学院蒋力教授与刘方鑫助理教授带领的 IMPACT 课题组完成,同时也获得了华为 2012 实验室和上海期智研究院的支持。第一作者是博士生汪宗武与硕士生许鹏。 在通用人工智能的黎明时刻,大语言模型被越来越多地应用到复杂任务中,虽然展现出了巨大的潜力和价值,但对计算和存储资源也提出...
开源大模型新王!Qwen3连发8种规格支持119种语言。 作者 | 程茜 编辑 | 心缘 阿里通义大模型新成员Qwen3系列模型终于亮相! 智东西4月29日报道,今日凌晨4点,阿里云正式开源Qwen3系列模型 ,包含2个MoE模型、6个稠密模型。发布2小时,Qwen3模型在GitHub上的star数已超过16.9k。 其中旗舰模型Qwen3-23...
新智元报道 编辑:编辑部 YZH 【新智元导读】阿里Qwen3凌晨开源,正式登顶全球开源大模型王座!它的性能全面超越DeepSeek-R1和OpenAI o1,采用MoE架构,总参数235B,横扫各大基准。这次开源的Qwen3家族,8款混合推理模型全部开源,免费商用。 就在今天凌晨,备受全球期待的阿里新一代通义千问模型Qwen3开源! 一经问世,它...