处理 PDF 文档的结构分析,是 OCR 与信息抽取中最“痛苦”的一环。尤其是面对含有标题、段落、表格、图像、公式等复杂元素的学术/业务类 PDF,普通 OCR 工具只能“识字”,却无法理解结构。 GitHub 上由 HURIDOCS 团队开源的 PDF Document Layout Analysis 不失为一款可靠的 OCR 神器。它能高精度识别 PDF...
MCP Server 实现了 Notion API, 包括获取post内容,评论,搜索等等。 参考文献: [1] 地址:https://github.com/makenotion/notion-mcp-server (文:NLP工程化) MCP Server 实现了 Notion API, 包括获取post内容,评论,搜索等最先出现在每时AI。
OmniSVG:一个强大的矢量图形生成模型,能将文字描述瞬间转化为复杂精美的SVG图像!亮点: 支持从简单图标到复杂动漫角色的多样化生成; 利用预训练视觉语言模型,生成效果细腻且逼真; 提供多种数据集,助力开发者快速上手。 参考文献: [1] http://github.com/OmniSVG/OmniSVG (文:NLP工程化) OmniSV...
AI-Scientist-v2:AI驱动的自动化科学发现系统,助力科学研究迈向新高度。亮点:1. 完全由AI生成的论文被学术会议接受,开创AI自主科研先河;2. 采用Agent树搜索技术,实现跨领域科学探索;3. 去除对人工模板的依赖,让AI自由发挥创造力。 参考文献: [1] http://github.com/SakanaAI/AI-Scientis...
今天凌晨2点30,全球最大财经媒体之一CNBC消息,特朗普继续将中国关税提升至145%。 对铝、汽车以及未纳入《美墨加协定》的来自加拿大和墨西哥的商品征收25%的关税。 投资者担心,即使部分关税有90天的暂停期,但特朗普对中国单独征收更高税率的关税仍会减缓经济活动。 受此消息影响,标准普尔500指数下跌2.9%,纳斯达克综合指数下滑 3.6%。道琼斯工业平...
ChatGPT正式上线全局记忆功能,能记住你所有的聊天记录,Sam Altman说这个新功能让他激动到觉都睡不好 记忆功能是什么? 全局记忆:ChatGPT现在能调用你所有历史对话(需用户授权),根据你的偏好、习惯甚至人生阶段提供个性化回答。写文案时自动匹配你的文风,学外语时记住你的薄弱点,堪称“AI界的终身学习伴侣” 精细控制:用户随时可在设置中关闭记...
根据Blind的调查数据,高达83%的营销和市场专业人员对数字化销售感到疲惫。同时,TimesPro指出,市场经理是企业中需求旺盛的岗位,未来懂得运用AI的营销人员需求也会不断增加。因此,AI营销智能体对于现代营销人员来说意义重大。 作为AI融入工作领域的新前沿,AI营销智能体能够精准、快速地处理任务,革新内容创作、推广及客户互动的方式。下面介绍八款国外好用...
谷歌发布了其第七代张量处理单元(TPU)——Ironwood,这也是首个专为大模型设计的AI芯片,适用于Gemini 2.5、Claude 3.7和Claude 3.5等先进模型。 与前代Trillium相比,Ironwood的能效提升了两倍;每块芯片配备192GB高带宽内存(HBM)和4.6PFLOPS的计算能力。相较于2018年发布的首代Cloud T...
今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。 这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。 但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主搜索、信息整...
今天凌晨1点,OpenAI对ChatGPT功能进行了大更新,新增长期记忆功能,可以记住你过去所有的聊天记录,会根据你的兴趣、偏好提供更个性化的回答。 这对于写小说、金融分析、教育等领域帮助巨大。如果你不喜欢这个功能,也可以随时关闭。 例如,你之前和 ChatGPT 聊天时,多次询问了关于科幻小说的写作技巧,还提到自己喜欢硬科幻风格以及喜欢阿西莫夫的作品。 ...