安爸-超级家庭
bg

AI信息差

为何钟情于机器人炫技?王兴兴:展示技术现状,释放商业价值|快讯

文| 杨柳 6月6日的2025北京智源大会上,宇树科技CEO王兴兴回应了公司频频进行机器人炫技的考量:在人形机器人真正去到工厂或家庭干活的终极目标尚未到来前,通过表演和赛事等形式,不仅向外界展示技术发展现状,也可以产生初步的商业价值。 自今年春晚爆火之后,宇树科技借势进一步展开“炫技”:从回旋踢、跳舞、武术到近期引发热议的格斗比赛,这家明星公司在赚足眼球的...

阅读:7 评论:0

Playwright MCP:微软打造的AI自动化利器,一键搞定浏览器操作

在AI技术飞速发展的当下,自动化工具正成为提升开发效率和软件质量的关键。微软推出的Playwright MCP项目,以其轻量级、高效能的特点,为AI大模型与浏览器自动化交互提供了全新的解决方案。本文将深入探讨Playwright MCP的技术原理、功能特性及应用场景,并通过实践案例展示其部署与使用方法。 一、项目概述 Playwright MCP是微软基于...

阅读:9 评论:0

谷歌刚刚更新!新版 Gemini 2.5 Pro:顶级推理 + 百万上下文还免费!

谷歌的 Gemini 2.5 Pro 又更新了,就在几小时前! Gemini 模型这更新速度没谁了,几乎是一个月一次。 上个版本,是 5 月 6 日发布的 I/O 版。 今天发布的新版 Gemini 2.5 Pro 代号 gemini-2.5-pro-preview-06-05,已正式在 AI Studio、Vertex AI、Gemini App 全面开放...

阅读:7 评论:0

关于智能体开发过程中问题的解决思路

“ 智能体开发过程中存在很多问题,但由于其执行过程是个黑盒,因此其调试存在更多的困难。” 最近一段时间一直在搞智能体方面的开发,主要方向是数据分析智能体;采用的框架是langchain家族的Langgraph框架;原因就在于Langgraph有很强的定制功能。 但是,在实际开发的过程中却一步一步坎,面临着各种各样的问题;比如说数据分析结果不准确,找不到数...

阅读:8 评论:0

有趣思考:如何带着问题去针对性学习-兼看大模型推理、强化、RAG等进展

今天是2025年6月6日,星期五,北京,晴 我们来回顾下大模型相关技术0605进展,围绕社区如何学习讨论,大模型实操项目集合,强化学习评估偏差,多模态一键换装,Deepseek-R1-0528蒸馏数据等进展,供各位参考。 其中,尤其是如何针对性的学习,是很多人的困境,所以来谈谈。 一、如何针对性的学习-带着问题去学习 社区昨天有个很有趣的话题,问题是“想要用...

阅读:7 评论:0

谷歌悄悄上线了一堆好玩的AI应用,下一个爆款可能藏在其中

作者 | Kino 编辑 | 张洁 欢迎来到“AI新榜”不定期更新栏目「挖到宝藏AI应用了」,为你四处搜罗一些有趣、实用但暂时小众的AI应用,本期为第1期,推荐下我们在Google Labs里淘到的宝 没想到谷歌竟然悄咪咪上线了这么多宝藏AI应用。 最近我在Google Labs里逛了一圈,最大的感受就是:说不定这里就藏着下一个爆款 AI 应用的前身...

阅读:9 评论:0

阿里巴巴开源Qwen3 Embedding 多语言排行榜中排名第一,微软开源GUI-Actor 无坐标的GUI代理视觉语言模型

**关注我,记得标星⭐️不迷路哦~ ✨ 1: Qwen3 Embedding Qwen3:多功能文本嵌入与排序模型 Qwen3 Embedding 模型系列,专为文本嵌入和排序任务而设计,基于 Qwen3 系列的密集基础模型构建。它提供了一系列不同规模(0.6B、4B 和 8B)的文本嵌入和重排序模型,继承了其基础模型的多语言能力、长文本理解和推理能力...

阅读:9 评论:0

可从表复杂文档中提取结构化数据的Python库agentic-doc,支持100+页PDF长文档

项目简介 LandingAI 的 Agentic 文档提取 API 能够从视觉复杂的文档(如表格、图片和图表)中提取结构化数据,并返回带有精确元素位置的层次化 JSON。 此 Python 库封装了该 API,提供以下功能: 长文档支持 – 单次调用处理 100+ 页的 PDF 自动重试/分页 – 处理并发、超时和速率限制 辅助工具 – 边界框片段、可视化...

阅读:9 评论:0

即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。

昨天晚上,即梦的最强AI绘图模型图片3.0,又又又更新了。 内测上线了即梦图片3.0的,智能参考,现在,可以垫图了。 MD,这次连设计师的参考图也一键干碎了。。。 我测了整整一夜,现在是凌晨4点21,我还在写这篇文章。 我人真的傻了,我真的不愿意用一些什么很夸张的词语,但是即梦的绘图,每一次,带给我的震撼,都会觉得,我这么多年的设计师生涯,在AI的进化速度...

阅读:9 评论:0

远超ChatGPT 4o,自然语言超级P图

最近黑森林工作室发布了Flux Kontext,目前发布了max和pro版本(付费),dev(开源)尚未放出。 Flux Kontext是最新一代多模态图像生成与编辑模型,其核心技术基于 流匹配架构(Flow Matching),突破了传统文本编码器与扩散模型分离的设计,实现了文本与图像的上下文感知生成与编辑。以下是其核心特点、技术优势及应用场景的详细分析:...

阅读:8 评论:0