AI产品_AI今日热点提供国内外人工智能一手新闻资讯-第3页-AI工具导航

Pika 2.2

Pika 2.2是由Pika Labs最新推出的升级版AI视频生成工具。利用深度学习技术，将图像或文字提示转换为高质量的视频内容。与旧版本相比，Pika 2.2在功能和性能上都有显著提升。支持生成长达10秒的视频，并提供1080p的高清分辨率。此外，引入了"Pikaframes"功能，通过关键帧过渡...

AI工具箱8个月前

Ideogram 2a

Ideogram 2a 是AI图像生成公司Ideogram最新推出的文生图模型，是对Ideogram 2.0进行全面优化的产品。这款模型注重高效性与实用性，显著提升了图像生成速度，并将成本降低了50%。在图形设计和摄影领域，Ideogram 2a表现出色，支持高质量的文本渲染，尤其在英文排版方面接近...

AI工具箱8个月前

Linkeddit

Linkeddit是一款基于人工智能的营销工具，旨在帮助用户在 Reddit 平台上精准挖掘潜在客户、合作伙伴或目标受众。通过先进的 AI 算法分析 Reddit 的用户数据，Linkeddit能够根据用户输入的需求描述，生成精准匹配的目标用户列表。用户可以根据用户的 karma 值、活跃时间和参与...

AI工具箱8个月前

Hero Stuff

“Hero Stuff”是一款基于人工智能技术的二手物品销售助手，其主要功能包括拍照识别物品、自动生成商品描述、实时定价建议、一键发布到多个平台、历史记录管理、多品类支持以及智能提示与优化。用户只需通过手机拍摄物品照片，Hero Stuff即可快速识别物品并生成详细描述，方便用户在二手交易平台销售物...

AI工具箱8个月前

SongGen

SongGen是由上海AI Lab、北京航空航天大学和香港中文大学合作开发的一种先进的单阶段自回归Transformer模型，专门用于根据文本生成歌曲。该模型接受歌词和描述性文本（如乐器、风格、情感等）作为输入，提供两种输出模式：混合模式和模式。混合模式生成包含人声和伴奏的合成音频，而模式则分别生成...

AI工具箱8个月前

EasyPic

“easypic – 免费AI抠图工具，高效识别分离图像主体与背景” EasyPic是什么 EasyPic是一款免费的在线AI背景去除工具，专为快速删除图片背景而设计。利用尖端的人工智能技术，它能够高效地识别并分离图像中的主体与背景，仅需几秒钟即可完成高质量的抠图。用户只需简单上传图片，系统将自动处...

AI工具箱8个月前

SEO AI Agent

SEO AI Agent 是一款由Writesonic推出的AI SEO自动化工具，采用先进的人工智能技术，为用户提供全面的SEO解决方案。这一工具能够快速完成关键词研究、竞争对手分析、内容优化策略制定等复杂任务，将传统SEO团队数周的工作压缩至几分钟。通过与Ahrefs、Google Search...

AI工具箱8个月前

CorrDiff

NVIDIA推出了一款名为CorrDiff的生成式人工智能（AI）模型，专注于处理全球气象数据。该模型采用先进的技术，能够将低分辨率的气象数据转换为高分辨率数据，从而提高气象预测的精确性和效率。CorrDiff的处理流程包括使用UNet架构来预测大气变量的条件均值，然后通过扩散模型对这些预测结果进行...

AI工具箱8个月前

Smallpond

DeepSeek开发的Smallpond是一个轻量级数据处理框架，基于DuckDB和3FS打造，旨在高效处理PB级数据集。结合DuckDB的分析能力和3FS的分布式存储特性，Smallpond能够快速加载、查询和转换数据，适用于需要大规模数据处理的用户和开发者。 Smallpond是专为高性能和大规...

AI工具箱8个月前

3FS – DeepSeek

3FS – DeepSeek推出的高性能分布式文件系统是专为人工智能训练和推理任务而设计的效率高效的文件系统。利用现代SSD和RDMA网络技术，3FS能够整合大量SSD的吞吐量和存储节点的网络带宽，实现高达6.6 TiB/s的读取吞吐量。该系统具有强一致性并提供通用文件接口，用户无需学习新的存储AP...

AI工具箱8个月前

GPT-4.5强大升级版

GPT-4.5是OpenAI最新推出的旗舰语言模型，具有卓越的性能。其采用了扩展的无监督学习方法，显著提升了模式识别、知识广度和创意生成能力，同时降低了虚假信息的输出，使得模型生成的对话更加自然并贴近人类交流习惯。GPT-4.5具备丰富的知识库、高度的情感智能和对用户意图的准确理解，适用于广泛的场景...

AI工具箱8个月前

Phi-4-Multimodal

Phi-4-Multimodal是微软最新推出的多模态语言模型，拥有 56 亿个参数，能够整合语音、视觉和文本处理于一个统一的框架内。该模型在多项基准测试中表现卓越，在自动语音识别（ASR）和语音翻译（ST）任务中，以 6.14% 的单词错误率高居 Hugging Face OpenASR 排行榜榜...

AI工具箱8个月前

Profiling Data

深度学习框架中的性能分析工具Profiling Data专为DeepSeek开源训练和推理框架而设计，采用PyTorch Profiler收集详细的程序运行数据。该工具有助于开发者深入分析和优化软件性能，进而提升整个系统的效率。 Profiling Data记录了程序的时间消耗、资源利用率以及通信模...

AI工具箱8个月前

麦琪的花园

"麦琪的花园"是由深圳奥拓盖母（AutoGame）推出的一款AI沙盒冒险游戏，融合了人工智能技术和沙盒玩法。在游戏中，玩家扮演一名退休的勇者，在奥兹大陆展开冒险之旅，建设营地，采集资源，搭建建筑，并探索充满神奇生物的大陆。这款创新游戏不仅提供个性化AI伙伴生成功能，玩家可通过上传照片或描述创造独一...

AI工具箱8个月前

IndexTTS

IndexTTS 是 B 站推出的文本转语音模型，它结合了 XTTS 和 Tortoise 模型的先进技术，采用了 GPT 风格的生成技术。这个系统在将文本转换为自然流畅的语音方面表现出色，尤其擅长处理中文文本。IndexTTS 不仅支持拼音纠正汉字发音，还可以利用标点符号来精准控制停顿，有效解决多...

AI工具箱8个月前

Phi-4-Mini

Phi-4-Mini是微软推出的一款专注于文本任务的小型语言模型，是 Phi-4 系列的最新成员，拥有 38 亿参数。该模型建立在密集的解码器-only Transformer 架构之上，结合了分组查询注意力、20 万词汇量和输入输出嵌入的共享，旨在提高速度和效率。Phi-4-Mini 在文本推理、...

AI工具箱8个月前

R1-Onevision

R1-Onevision是一款开源的多模态大语言模型，专注于处理复杂的视觉推理任务。它基于 Qwen2.5-VL 进行微调，能够有效整合视觉和文本数据，实现精准的多模态信息解析。在数学、科学、深度图像理解和逻辑推理等领域表现优秀，超越了竞争模型 Qwen2.5-VL-7B 和 GPT-4V。 R1-...

AI工具箱8个月前

开发者必备：a0.dev

a0.dev 是一款基于人工智能技术的开发平台，专注于快速构建 React Native 应用。该平台通过自然语言输入，能够生成完整的 React Native 项目代码，包括前端界面、状态管理、路由设置以及后端云函数模板等。a0.dev 提高了开发效率，降低了移动端开发的技术门槛，特别适合开发者用...

AI工具箱8个月前

All Voice Lab

All Voice Lab是一个全球领先的AI语音创作平台，致力于为用户提供一站式的智能语音解决方案。该平台基于趣丸科技与香港中文大学（深圳）共同研发的MaskGCT语音大模型，旨在帮助全球创作者跨越语言和技术障碍，实现内容创作和国际传播的高效性。All Voice Lab支持中文、英语、法语、德语...

AI工具箱8个月前

Zapier Agents

Zapier Agents 是一款由 Zapier 推出的 AI 自动化助手工具，旨在帮助用户高效完成各种任务。该工具能够与超过7000个应用程序进行无缝连接，包括 Salesforce、Google Sheets 和 Slack 等。用户可通过自然语言与 AI 助手进行互动，指派任务，进行数据查询...

AI工具箱8个月前

VideoGrain

VideoGrain是由悉尼科技大学与浙江大学共同开发的视频编辑框架，旨在实现零样本多粒度视频编辑，包括类别级、实例级和部件级的精细化修改。该框架结合了调节时空交叉注意力与自注意力机制，以提高文本提示对目标区域的控制能力，并确保不同区域特征的分离，有效解决了扩散模型中存在的语义错位和特征耦合问题。相...

AI工具箱8个月前

腾讯首款混合动力Turbo S发布

腾讯混元Turbo S是腾讯最新推出的前沿快思考模型，采用了创新的Hybrid-Mamba-Transformer融合架构。这一设计有效降低了传统Transformer的计算复杂性，减少了KV-Cache缓存占用，同时大幅提高了训练和推理效率。将Mamba架构无损应用于超大型MoE模型，Turbo ...

AI工具箱8个月前

救救图片

"救救图片"是一款基于人工智能技术的在线图片处理工具，可去除图片水印、修复模糊、无损放大、去除马赛克等。该工具采用先进的AI算法，能精准识别并移除各类水印，保持高清质量。用户可选择不同格式下载处理后的图片，操作简单且适合新手使用。救救图片主要功能包括AI去水印、一键抠图、去马赛克、无损放大、涂抹擦...

AI工具箱8个月前

OCR文字识别软件产品 – olmOCR

olmOCR是由Ai2开发的开源工具，旨在高效地将PDF文档转换为清晰且结构化的纯文本。它结合了文档锚定技术和Qwen2-VL-7B-Instruct（阿里多模态模型），可处理多种类型的PDF文档，如学术论文、书籍、表格和图表。olmOCR通过提取文本和布局信息，结合页面图像，更准确地提取内容并保留...

AI工具箱8个月前

EPLB（Expert Parallelism Load Balancer）

EPLB（Expert Parallelism Load Balancer）是DeepSeek开发的专家并行负载均衡器，旨在解决大规模模型训练中不同专家模型之间负载不均的问题。该负载均衡器采用冗余专家策略，通过复制高负载专家并合理分配至不同的GPU，以实现负载均衡。同时，结合了group-limit...

AI工具箱8个月前

SynClub

SynClub是一款由百度推出的面向海外市场的AI社交应用，旨在为用户提供与虚拟AI朋友互动的独特社交体验。用户可以自定义属于自己的AI角色，角色能够学习适应用户的习惯和喜好，提供个性化的情感支持和陪伴。通过支持文字和语音交流，SynClub为用户提供安全的环境，让他们能够轻松分享生活中的点滴、感受...

AI工具箱9个月前

OctoTools

斯坦福大学推出的开源智能体框架 OctoTools 旨在应对复杂的推理任务，其主要功能包括：处理多样化任务、工具卡片封装、多步骤推理与任务规划以及工具集优化等。通过工具卡片，OctoTools能以标准化方式集成各种工具，规划器生成任务计划，执行器执行命令，并通过多步推理逐步解决问题。项目的官网地址为...

AI工具箱9个月前

Landing

Landing是一款基于人工智能技术的落地页生成工具，能够在短时间内快速创建出精美的网页。用户只需提供品牌相关信息和关键词，Landing就能自动识别品牌风格，生成相应的文案、图片和设计布局。无需编码技能，用户还可以利用可视化编辑器轻松定制页面元素，实现个性化设计。 Landing的主要功能包括： ...

AI工具箱9个月前

rtrvr.ai

rtrvr.ai是一款利用人工智能技术的浏览器扩展工具，专注于以自然语言指令简化网页浏览和自动化任务。用户只需通过语音或文字命令，就能进行网页导航、数据提取、表单填写等多项操作。该工具支持在不同标签页之间进行操作，方便用户比较价格或批量提取信息，并且可以直接将收集的数据导出至Google Sheet...

AI工具箱9个月前

吐司AI写真

“吐司AI写真”是吐司TusiArt平台推出的一款创新型AI写真工具。该工具利用先进的AI绘画大模型，对用户上传的图片进行风格化处理或重新生成，生成高度逼真的写真照片，效果类似于真实摄影作品。在社交媒体内容创作中得到广泛应用，尤其在小红书等平台上，能够生成多样化且引人注目的高质量照片，帮助用户吸引粉...

AI工具箱9个月前

Flame

Flame是一款开源的多模态AI模型，专为将UI设计截图转化为高质量的现代前端代码而设计。该模型利用视觉语言建模、自动化数据合成以及结构化训练流程，能够生成符合React等现代前端框架标准的代码，支持组件化、状态管理及动态交互功能。相较传统模型仅生成静态代码的方式，Flame采用创新的数据合成方法，...

AI工具箱9个月前

SurveyX

SurveyX是由中国人民大学、悉尼大学和中国东北大学共同开发的一种基于大型语言模型（LLMs）的自动化生成学术综述的创新系统。用户只需提供论文标题和相关关键词，SurveyX即可快速生成高质量、针对特定领域的学术综述或研究论文。这一系统采用了前沿的语言模型技术，辅以高效的数据处理和文献检索能力，显...

AI工具箱9个月前

TinyR1-Preview

奇虎360与北京大学联合推出了TinyR1-Preview，这是一款推理模型，参数量为32B。该模型以低参数量实现了类似Deepseek-R1-671B的性能。在数学领域（AIME评测），TinyR1-Preview的得分为78.1，接近于原版R1（79.8分），远超过70B的Deepseek-R1...

AI工具箱9个月前

DeepGEMM

DeepGEMM是DeepSeek开发的开源库，旨在提供高效且简洁的FP8矩阵乘法（GEMM）功能。此库特别针对NVIDIA Hopper架构的张量核心进行优化。除了支持常规的GEMM操作外，DeepGEMM还能够在混合专家（MoE）模型中进行分组矩阵乘法操作。其采用即时编译（JIT）技术，在运行时...

AI工具箱9个月前

Wan2.1

Wan2.1是一款由阿里云推出的开源AI视频生成大模型，具备强大的视觉创作能力。该模型支持文本生成视频和图像生成视频两大任务，同时提供专业版和极速版两种不同尺寸的模型：专业版含有14B参数，擅长处理复杂生成和物理建模，性能卓越；而极速版含有1.3B参数，在消费级显卡上能够流畅运行，显存需求低，特别适...

AI工具箱9个月前

PySpur

PySpur是一款开源的，旨在简化人工智能系统开发流程的可视化AI智能体工作流构建工具。用户可以通过直观的拖拽式界面快速构建、测试和迭代AI工作流，无需编写复杂代码。PySpur具备循环与记忆功能、文件上传、结构化输出、RAG技术和多模态数据处理（包括文本、图像、视频等），并能与多种工具（如Slac...

AI工具箱9个月前

元镜

元镜是一款基于人机共生引擎的AI视频创作系统，旨在将创意构思快速转化为成品视频。该系统具有自动化脚本生成、统一角色风格、多模态融合和智能化工作流程等功能，能显著提升创作效率，满足短视频、广告、教育和影视等多个行业的需求。元镜的主要功能包括：创意视频脚本生成，提供多模态创意分镜设计，以及分镜一键成片...

AI工具箱9个月前

吐司AI LOGO

"吐司AI LOGO"是吐司TusiArt推出的一款创新型AI图标生成应用，旨在帮助用户通过详细的描述轻松创建个性化LOGO。这一工具特别适合需要快速建立独特品牌形象的用户，在创意设计和品牌推广方面表现出色。该工具由吐司TusiArt开发，提供了诸多功能，包括文本描述生成图像、上传基础图像结合文本...

AI工具箱9个月前

VLM-R1

VLM-R1是浙江大学Om AI Lab推出的一款视觉语言模型，采用强化学习技术。该模型可以根据自然语言指令精确定位图像中的目标物体，例如根据描述"图中红色的杯子"找到对应图像区域。VLM-R1建立在Qwen2.5-VL架构基础上，结合了DeepSeek的R1方法，通过强化学习优化与监督微调（SFT...

AI工具箱9个月前

问小白PPT

问小白PPT生成 – 一键生成PPT服务的便捷选择问小白PPT生成简介问小白PPT生成是由问小白与AiPPT联合推出的一项快捷的PPT生成服务。用户只需提供所需的大纲或主题，平台即可快速生成完整的PPT文件，并支持免费下载。该服务基于DeepSeek R1 671B满血版，具有高稳定性和零延迟。...

AI工具箱9个月前

AI产品

热门AI工具

热门AI应用