安爸-超级家庭
bg

AI进家庭

字节Dolphin:多模态文档图像解析模型

模型描述 Dolphin(通过异构锚点提示的文档图像解析)是一种新颖的多模态文档图像解析模型,采用“分析后解析(analyze-then-parse)”的范式。该模型通过两阶段的方法,专为处理文本段落、图表、公式和表格等高度交织的文档元素设计,以应对复杂文档理解的挑战。 概述 文档图像解析面临的主要挑战在于其内容元素高度交织,如文本段落、图表、公式和表格。D...

阅读:10 评论:0

QwenLong-L1:迈向具备长上下文推理能力的大型语言模型的强化学习方法

在本研究中,我们提出了 QwenLong-L1,这是一种新颖的强化学习(RL)框架,旨在促进大语言模型(LRMs)从短上下文任务的熟练应对向强健的长上下文泛化能力的转变。在初步实验中,我们展示了短上下文推理与长上下文推理在强化学习训练动态上的差异。 该框架通过 逐步扩展上下文长度 的方式,在强化学习训练中增强短上下文大语言模型的能力。框架由三个核心组件构成...

阅读:11 评论:0

AI开发者盛宴!NVIDIA DPU 黑客松助力想法变为现实!

程序员高能预警!全球最硬核的DPU算力狂欢节来了! 第三届NVIDIA DPU中国虚拟黑客松近期已开放报名,该竞赛是堪比刷 LeetCode 更硬核的简历镀金术:在BlueField上留下你的git commit记录,还有和NVIDIA高级专家对话交流学习的机会。 _可能未来的AI基建会有你贡献的一份力! 第三届 NVIDIA DPU 中国虚拟黑客松(Hac...

阅读:10 评论:0

go 写的操作文件系统的 MCP Server:mcp-filesystem-server

通过这个MCP就可以操作本地文件系统了,由于这个是go编写的,go能交叉编译的架构特别多,所以理论上大部分系统都能运行这个MCP Server。 参考文献: [1] http://github.com/mark3labs/mcp-filesystem-server 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下...

阅读:12 评论:0

80亿美元押注Agent!全球第一CRM收购Informatica

昨晚,全球第一CRM平台Salesforce在官网宣布,以80亿美元全资收购企业级AI驱动云数据管理领导者Informatica。 根据收购协议条款,Informatica的A股和B-1类普通股持有者将每股获得25美元现金。 本次收购将增强Salesforce的数据基础,这对部署强大且负责任的AI Agent至关重要。Informatica 丰富的数据目录...

阅读:14 评论:0

突发!特朗普暂停,国际学生签证

今天凌晨,彭博消息,美国国务卿鲁比奥已下令,美国驻全球大使馆暂停为学生签证申请人安排新的面试。 同时特朗普正考虑对申请人的社交媒体资料进行更严格的审查。 今天凌晨,美国国务院向全球外交官发出的一份电报中表示,“为准备扩大所需的社交媒体筛查和审查,即日起,在收到后续指导(预计将在未来几天发出)之前,领事部门不应增加任何额外的学生或交流访问者签证预约名额。 ...

阅读:10 评论:0

用户举报“开盒挂人”需要几步?实测10款重点App

文| 樊文扬 5月27日,中央网信办发文部署进一步加强“开盒”问题整治工作,称下一步将指导网站平台升级完善防护措施,加大“开盒”风险提示力度,设置涉“开盒”举报快速入口,及时核实网民投诉举报等。当日,南都·隐私护卫队对微博、抖音、百度贴吧等10款App“网络开盒”相关行为举报渠道的便捷性进行实测。 实测结果显示,10款被测App——微博、微信、QQ、抖音、...

阅读:12 评论:0

AI赛道隐形高手?!美团王兴披露内部基础大模型表现接近GPT-4o,机器人投资遍地开花

文丨谭梓馨 提到美团,大部人的第一印象可能停留在本地生活电商、外卖服务等方面,但在不知不觉中,美团已经成为AI大模型和机器人赛道一个举足轻重的巨头玩家。 5月26日,美团召开2025第一季度业绩电话会,财务方面,营收865.6亿元,同比增增长18.1%,调整后净利润109.5 亿元,同比增长46.2%,经营成绩又创新高。 在电话会议中,当股东提问到关于...

阅读:9 评论:0

开源音视频转各种风格文档,一个真正有落地场景的开源AI项目,我也想落地一个。

今天给大家推荐的开源项目,是真的有落地场景的。 而且项目作者把场景都给大家想好了,至于怎么落地怎么推,就见仁见智了。 有落地的想法的话,也可以一起聊聊。 MIT协议,随便商用。 功能很清晰,把音视频做成各种风格的文档。 扫码加入AI交流群 获得更多技术支持和交流 (请注明自己的职业) 项目简介 AI-Media2Doc 是一个开源的音视频转文档工具,它能...

阅读:10 评论:0

全彩显示的AI眼镜来了!8999元带走阿里大模型和最强光波导

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。 雷鸟X3 Pro搭载了4nm高通骁龙AR1平台,支持光波导全彩显示,重量仅为76g。 在AI上,雷鸟延续了之前V3的部署方式,继续与阿里通义深度合作,内置了定制化的多模态大模型,可以面对眼前看到的一切,...

阅读:10 评论:0