安爸-超级家庭
bg
avatar

安爸

3B小模型吊打72B巨头!轻量级文档解析OCR,性能超Gemini,高效且精准!

在文档解析领域,传统方法要么依赖复杂多工具流水线,要么受限于大型多模态模型的低效性。 近日,Yuliang-Liu团队在GitHub上开源了一款轻量级基于LLM的文档解析模型:MonkeyOCR。 它以创新的“结构-识别-关系”(SRR)三元组范式,实现了高效且精准的文档解析。其3B参数模型在英文文档解析任务中超越了Gemini 2.5 Pro和Qwen2...

阅读:8 评论:0

Supermemory MCP:跨大型语言模型的通用记忆系统

这个项目给AI一个 system prompt,要求 AI 每次聊天都必须使用 tool call 将上下文塞给这个 MCP,然后 MCP 只需要使用向量数据库将需要保存的信息记录即可。然后每次聊天再按需查询,确保能获得历史聊天或者用户洞察。 参考文献: [1] https://github.com/supermemoryai/supermemory-m...

阅读:7 评论:0

Kokoro TTS:一款强大的CLI文字转语音工具,能将文本快速转换为自然流畅的语音

Kokoro TTS:一款强大的CLI文字转语音工具,能将文本快速转换为自然流畅的语音。亮点:1. 支持多种语言和声音,还能自定义声音混合比例;2. 支持EPUB、PDF和TXT等多种输入格式;3. 可实时流式播放音频,也能按章节分割输出。 参考文献: [1] http://github.com/nazdridoy/kokoro-tts [2] http...

阅读:7 评论:0

Awesome-Multimodal-LLM-for-Code:专注于多模态场景下代码生成的资源库

Awesome-Multimodal-LLM-for-Code:一个专注于多模态场景下代码生成的优秀资源库。它能解决多模态代码生成领域的资源分散问题,为研究人员和开发者提供一站式的论文、数据集和工具汇总。吸睛亮点:1. 涵盖多种代码生成场景,如Web前端、科学绘图、PPT生成等;2. 提供大量高质量的论文和数据集资源;3. 持续更新,紧跟最新研究进展。 ...

阅读:7 评论:0

AI Screenshot Translator:简单实用的截图翻译工具

GitHub 上 AI Screenshot Translator 这款简单实用的截图翻译工具,解决了对于图像扫描的外文 PDF 文件,无法直接复制文本翻译问题。通过自定义快捷键一键截图,AI 自动识别并翻译图片中的文字,能完美解决 PDF 数学公式复制难题。此外,可自定义 API 接口,支持多种主流模型,还支持多窗口贴片管理,随意拖放缩放对比翻译结果。提供...

阅读:8 评论:0

Meta与Constellation Energy签署20年核电协议

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 全球社交巨头Meta在官网宣布,与美国最大的无碳电力生产商Constellation Energy签署了一项为期20年的核能购买协议,以支持其数据中心不断增长的能源需求并推进AI发展计...

阅读:7 评论:0

突发!特朗普派700名海军陆战队,逮捕加州州长

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 今天凌晨12点45,CNBC消息,大约700名美国海军陆战队员从加州二十九棕榈军事基地调动,以支援加州国民警卫队保护洛杉矶联邦人员和财产。 特朗普则表示,支持海军陆战队逮捕加利福尼亚州...

阅读:7 评论:0

史上最美苹果系统登场!六大OS大变样,AI模型免费开放,新Siri又鸽了,WWDC25一文看尽

今年苹果WWDC大会,太太太太抽象了! 作者 | 云鹏 程茜 编辑 | 漠影 智东西6月10日报道,今天凌晨,苹果开发者大会WWDC25正式开幕,iOS、iPadOS、macOS、visionOS、watchOS、tvOS六大系统用上了全新的统一设计和新的“Liquid Glass(流体玻璃)”设计元素,美观程度肉眼可见的提升了一大截。 ▲Li...

阅读:7 评论:0

苹果OS全家桶12年最狠升级!AI入侵一切,唯独Siri没更

新智元报道 编辑:编辑部 NYH 【新智元导读】春季WWDC开幕,苹果OS全家桶迎来十多年来最大版本升级!与此同时,苹果AI也得到巨大进化——不仅支持实时翻译,还能看屏搜一切。两小时发布会,可谓是看点满满。 不出所料,苹果的下一代系统,就是26。 刚刚,在苹果春季WWDC发布会上,库克现身苹果园,一出手就是F1大片。 这场开发者大会的焦点,不仅...

阅读:8 评论:0

iPhone系统最激进更新来了!iOS 26变玻璃,iPad迎「史诗级升级」,苹果AI「明年再说」

一块玻璃,意外抢走了 WWDC 上苹果 AI 的风头。 去年,苹果在 WWDC 上高调推出 Apple Intelligence,重新定义果式 AI,但刚刚召开的 WWDC 却又回到了苹果最熟悉的舒适区,开始讲 UI,讲系统,讲体验。 整场发布会的核心,是一次 UI 层面的深度重构,也是自 iOS 7 以来跨度最大的一次设计体系升级。从 iPhone 到 ...

阅读:8 评论:0