AI产品

共 134 篇文章

HeyReal

HeyReal 是一家专注于个性化虚拟角色互动的平台，允许用户根据自己的兴趣和需求定制独特的虚拟角色，包括外貌、性格特征和背景故事。通过先进的AI技术，HeyReal 能够生成自然流畅且创意丰富的对话，使用户能够像与真实人物互动一样与虚拟角色进行交流。平台还提供丰富的预设角色库，覆盖多种风格，以满足...

AI工具箱8个月前

HeyReal

CreatorKit

CreatorKit是一款先进的AI内容创作工具，专为电商行业设计。利用AI技术，CreatorKit可以高效生成优质的产品图片、视频和广告，同时提供一键生成广告和产品视频的功能。该工具与Shopify深度整合，确保生成内容在各种平台上表现出色。同时，CreatorKit还提供AI图片编辑功能，用户...

AI工具箱8个月前

CreatorKit

PRefLexOR

MIT团队研发的新型自学习人工智能框架PRefLexOR融合了偏好优化和强化学习概念，通过推理提升自我学习能力。其核心算法是递归推理，模型通过多轮推理、反思和优化生成更准确结果。使用基于优势比偏好优化（ORPO）和直接偏好优化（DPO）的技术，协调推理路径并提升质量。 PRefLexOR的功能包括动...

AI工具箱8个月前

PRefLexOR

MindLLM

MindLLM是由耶鲁大学、达特茅斯学院和剑桥大学共同研发的一种先进的人工智能模型，能够将脑部功能性磁共振成像（fMRI）信号解码为自然语言文本。通过结合主体无关的fMRI编码器和大型语言模型（LLM），以及引入脑指令调优（BIT）技术，MindLLM成功捕捉了fMRI信号中的丰富语义信息。在众多基...

AI工具箱8个月前

MindLLM

Probly

Probly 是一款创新的 AI 驱动电子表格工具，将电子表格的便捷性与 Python 数据分析的强大功能相结合。通过利用 WebAssembly 技术在浏览器中直接执行 Python 代码，Probly 支持用户进行交互式操作、数据可视化以及智能分析建议。用户可以轻松导入数据，并快速生成分析结果或...

AI工具箱8个月前

Probly

Fractal Generative Models

麻省理工推出的分形生成模型（Fractal Generative Models）是一种创新的图像生成技术，由麻省理工学院计算机科学与人工智能实验室与Google DeepMind团队共同研发。该模型基于分形理论，将生成过程抽象为可重用的“原子模块”，通过递归调用这些模块，构建出具有自相似特性的分形结...

AI工具箱8个月前

Fractal Generative Models

MiniMind

MiniMind是一个开源的超小型语言模型项目，致力于帮助个人开发者以极低的成本构建自己的语言模型。该项目拥有轻量化设计，包含多种训练技术和完整的训练流程代码，适用于普通个人GPU进行训练。MiniMind支持多模态能力，与主流框架兼容，并提供高质量的数据集和自定义分词器，是LLM初学者的理想选择。...

AI工具箱8个月前

MiniMind

CogView4

CogView4是一款由智谱科技推出的开源文生图模型，拥有60亿个参数，能够支持中文输入和文字生成。在DPG-Bench基准测试中表现优异，综合评分排名第一，成为开源文生图模型领域的最新标杆。这个模型支持中英双语输入，可以生成高质量的图像，也能够生成任意分辨率的图像，范围从512×512到2048...

AI工具箱8个月前

CogView4

AgiBot Digital World

智元机器人推出了一款名为AgiBot Digital World的机器人仿真框架，旨在支持机器人操作技能的研究与应用。这一框架结合了大量真实的三维资产、多样化的专家轨迹生成机制以及全面的模型评估工具，通过高度逼真的模拟和全链路的自动化数据生成，能够快速构建多样化的机器人训练场景。 AgiBot Di...

AI工具箱8个月前

AgiBot Digital World

Tanka

Tanka 是一种具备长期记忆能力的 AI 智能通讯工具，专为团队协作而设计。它能够通过记忆过去的对话和业务背景，提供智能回复、要点总结及提醒设置等功能，以帮助团队更高效地进行沟通与协作。Tanka 支持多模态消息处理，并可以与 Slack、WhatsApp、Outlook 等常用通讯工具进行无缝集...

AI工具箱8个月前

Tanka

Videco

Videco是一款专注于销售和市场推广的AI驱动个性化视频生成平台。利用先进的AI技术，Videco能够实现语音克隆和动态变量功能，为每位潜在客户定制高度个性化的视频内容。通过集成互动元素（如表单、调查、行动号召）以及与CRM和邮件工具的无缝连接，Videco助力企业提升客户参与度，增加销售线索的转...

AI工具箱8个月前

Videco

Spark-TTS

Spark-TTS是一款由SparkAudio团队推出的AI文本转语音工具，支持中英文零样本语音克隆。该工具基于大型语言模型（LLM）构建，能够在没有额外生成模型的情况下，直接通过LLM预测的编码重建音频，实现零样本文本到语音的转换。用户可以通过调节参数（如性别、音调、语速等）来生成符合个性化需求的...

AI工具箱8个月前

Spark-TTS

HumanOmni

HumanOmni是一款专注于人类中心场景的多模态大模型，由阿里通义等推出。该模型融合了视觉和听觉信息，旨在全面理解人类的行为、情感和互动。通过处理视频、音频或两者的结合输入，HumanOmni展现出卓越的情感识别、面部表情描述和语音理解能力。基于超过240万段视频和1400万条指令的预训练，Hum...

AI工具箱8个月前

HumanOmni

ARTalk

ARTalk是由东京大学与日本理化学研究所共同开发的先进语音驱动3D头部动画生成框架。该系统基于自回归模型，能实时生成高度同步的唇部动作、自然的面部表情以及头部姿势。通过结合多尺度码本和滑动时间窗口技术，ARTalk能根据音频输入生成高质量的动画序列，引入了风格编码器适应不同的说话风格。在唇部同步精...

AI工具箱8个月前

ARTalk

Shandu

Shandu是一款开源的人工智能研究自动化工具，融合了LangChain和LangGraph的先进技术，能够高效地进行多层次的信息挖掘与分析，从而生成结构化的研究报告。用户只需通过简单的命令行输入研究主题，并设定深度和广度参数，便能快速生成包含引用的Markdown格式报告。Shandu支持多个搜索...

AI工具箱8个月前

Shandu

ViDoRAG

ViDoRAG是由阿里巴巴通义实验室与中国科学技术大学、上海交通大学共同开发的视觉文档检索增强生成框架。该框架利用多智能体协作及动态迭代推理技术，克服了传统方法在处理复杂视觉文档时面临的检索与推理的局限性。ViDoRAG通过高斯混合模型（GMM）实现多模态混合检索策略，能够动态调整检索结果的数量，从...

AI工具箱8个月前

ViDoRAG

SepLLM

SepLLM – 分隔符压缩加速大语言模型的高效框架 SepLLM简介 SepLLM是香港大学和华为诺亚方舟实验室等机构共同研发的高效框架，旨在加速大型语言模型（LLM）的推理过程。SepLLM通过有效地压缩段落信息并消除冗余标记，显著提高了模型的推理速度和计算效率。该框架的关键创新在于利用分隔符（...

AI工具箱8个月前

SepLLM

LCVD

LCVD是四川大学推出的一款名为“光照可控视频扩散模型”（Lighting Controllable Video Diffusion Model）的肖像动画生成框架。该框架能够高保真地生成具有可控光照效果的肖像动画，通过将肖像的内在特征（如身份和外观）与外在特征（如姿态和光照）进行分离，并使用参考适...

AI工具箱8个月前

LCVD

Mochii AI

Mochii AI是一款多功能智能助手，利用先进的人工智能技术来提高用户的工作效率和创造力。它整合了各种高级AI模型，如GPT-4、Claude 3.5和Gemini，可提供智能对话、语音交互、文档分析和网页总结等多项服务。用户可以通过浏览器插件、桌面应用或移动设备随时访问Mochii AI。 Mo...

AI工具箱8个月前

Mochii AI

海螺视频APP

海螺视频APP是MiniMax推出的一款AI视频生成工具，通过人工智能技术帮助用户轻松制作高质量的视频内容。该应用支持文字生成视频（T2V）和图像生成视频（I2V）功能，用户只需输入文本或上传图片，即可生成生动的动态视频。海螺视频APP独特之处在于其“镜头控制”功能，提供多种镜头效果，并支持用户自定...

AI工具箱8个月前

海螺视频APP

story-flicks

"story-flicks" 是一款 AI 视频生成工具，可通过一键操作生成高清故事短视频。用户只需输入故事主题，系统将应用先进的 AI 技术，自动生成包含图像、文本、音频和字幕的短视频。该项目支持多种模型提供商，如 OpenAI 和阿里云，用户可以根据需求选择不同的文本和图像生成模型。视频时长可根...

AI工具箱8个月前

story-flicks

Alexa+

亚马逊推出了一款名为Alexa+的新一代智能助手，采用了先进的云生成式AI技术，提供了全面升级。Alexa+通过高效的架构将大规模语言模型、代理功能、各种服务和设备紧密连接，实现了更自然、智能和个性化的对话体验。用户可以与Alexa+进行流畅的自然语言交流，完成多样化的任务，包括智能家居控制、餐厅预...

AI工具箱8个月前

Alexa+

WhisperChain

WhisperChain 是一款AI实时语音转文字工具，旨在提高工作效率。该工具利用 Whisper.cpp 实现实时语音转文本功能，并结合 LangChain 对文本进行清理和优化，去除冗余词汇，编辑和精炼内容。此外，WhisperChain 提供全局快捷键功能，用户可随时启动语音输入，将清理后的...

AI工具箱8个月前

WhisperChain

Avat3r

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的一款高保真三维头像重建模型，能够在仅需几张输入图像的情况下，生成高质量且具备动画效果的 3D 头部头像，显著降低了计算资源的需求。该模型通过大规模多角度视频数据集的学习，掌握了强大的三维人头先验知识，并结合 DUSt3...

AI工具箱8个月前

Avat3r

T2V-01-Director

海螺AI推出的 T2V-01-Director 是一款文本到视频生成工具，旨在通过自然语言指令实现精准的镜头控制。该工具使用户能够轻松创建电影级的视频效果，支持多种镜头组合，如左移、右摇、推进和拉远，满足复杂场景拍摄需求。 T2V-01-Director 是海螺AI（MiniMax）推出的创新性文本...

AI工具箱8个月前

T2V-01-Director

星火医疗大模型X1

星火医疗大模型X1是科大讯飞推出的深度推理大模型，专为医疗领域设计。该模型利用先进的深度推理技术，能够逐步解释循证过程，有效减少医疗幻觉问题，提升医疗推理的逻辑性和专业性。已在诊断推荐、健康咨询和检查检验报告解读等方面广泛应用，性能超越了GPT-4o和DeepSeek R1。星火医疗大模型X1以其...

AI工具箱8个月前

星火医疗大模型X1

高效学习神器TurboLearn

TurboLearn是一款创新的人工智能学习工具，能够高效将录音和PDF文档转化为学习资料，包括笔记、闪卡、测验和播客等多种形式。该工具支持在笔记中插入表格、图形、公式和表情符号，并提供智能功能，帮助用户从笔记中提取关键信息。TurboLearn的笔记可以在应用程序和官方网站之间同步，确保用户随时能...

AI工具箱8个月前

高效学习神器TurboLearn

飞书知识问答平台

飞书知识问答是飞书智能办公平台推出的一款高效的知识管理与问答工具，旨在帮助企业提高信息获取速度和知识共享效率。借助先进的人工智能技术，该工具支持实时联网搜索和多种文件格式的解析，可以连接多种数据源，包括本地文档、飞书云文档以及企业业务系统，迅速生成简明、结构化的答案。该工具的核心功能包括智能问答、...

AI工具箱8个月前

飞书知识问答平台

xAR

xAR是字节跳动与约翰·霍普金斯大学合作开发的一款自回归视觉生成框架。该框架利用“下一个X预测”和“噪声上下文学习”技术，解决了传统自回归模型在视觉生成中信息密度不足和累积误差问题。xAR具有以下主要功能：下一个X预测：超越传统“下一个标记预测”，可预测更复杂的视觉实体，捕捉更丰富的语义信息。噪...

AI工具箱8个月前

xAR

MakeBestMusic

MakeBestMusic是一款基于人工智能技术的音乐创作平台，旨在帮助用户快速生成个性化且高质量的音乐作品。用户可以凭借简单的文本描述生成器乐或人声音乐，同时还可以上传音频文件进行分离、混音和再创作。该平台覆盖多种音乐风格，提供从免费到专业版的多种付费计划，满足不同用户的需求。MakeBestMu...

AI工具箱8个月前

MakeBestMusic

WarriorCoder

WarriorCoder是华南理工大学计算机科学与工程学院与微软合作推出的一款代码生成大语言模型（LLM）。其创新之处在于模拟不同专家模型之间的对抗，以生成高质量的训练数据，从而显著提升模型的性能。与传统方法不同，WarriorCoder摒弃了对现有专有模型或数据集的依赖，而是采用从零开始挖掘指令的...

AI工具箱8个月前

WarriorCoder

WorldCraft

WorldCraft是香港科技大学开发的3D虚拟世界创建和定制系统，利用大型语言模型代理技术，帮助用户构建个性化的3D虚拟环境。用户可以通过自然语言交互轻松生成复杂的室内外场景，并对场景中的物体和布局进行精细的调整。WorldCraft包含ForgeIt、ArrangeIt和轨迹控制模块，用于物体定...

AI工具箱8个月前

WorldCraft

AI-Infra-Guard

腾讯开源的AI基础设施安全评估工具AI-Infra-Guard，具有高效、轻量且易于使用的特点。该工具能够发现和检测AI系统中的潜在安全风险，支持28种主流AI框架的指纹识别，覆盖了超过200个安全漏洞数据库，可以快速扫描并识别漏洞。 AI-Infra-Guard的主要功能包括：高效扫描：支持28...

AI工具箱8个月前

AI-Infra-Guard

Mobius

Mobius是一项由重庆邮电与美团等合作推出的无缝循环视频生成技术。这种先进技术利用人工智能算法，将文字描述转化为无限循环的视频内容。其关键在于强大的AI模型，能够自动识别视频中的关键元素，生成平滑过渡的循环片段，无需用户进行繁琐编辑。Mobius简化了视频创作过程，适合各种技能水平的创作者，并在广...

AI工具箱8个月前

Mobius

LDGen

：LDGen支持多种语言，包括但不限于英语、中文、西班牙语、法语和德语等主流语言。 LDGen的图像生成速度如何？：LDGen在生成图像时具备较快的速度，能够快速响应用户输入并生成高质量的图像。 LDGen与其他文本到图像技术相比有何优势？：LDGen通过引入多语言零样本生成、语言表示优化和跨模态精...

AI工具箱8个月前

LDGen

HippoRAG

俄亥俄州立大学推出的检索增强生成框架HippoRAG 2旨在弥补传统RAG系统在模拟人类长期记忆动态性和关联性方面的不足。其使用个性化PageRank算法实现深度段落整合和更高效的在线大型语言模型（LLM）应用，使在知识检索和生成过程中更贴近人类记忆效果。 HippoRAG 2作为一种创新型的检索增...

AI工具箱8个月前

HippoRAG

VidSketch

VidSketch是一款由浙江大学CAD&CG国家重点实验室与软件学院合作推出的创新视频生成框架。它利用用户的手绘草图和简单的文字提示，能够生成高质量的视频动画。该系统采用了"层级草图控制策略"，可以动态调整草图的引导强度，以适应不同绘画技能水平的用户。此外，VidSketch还利用了"时空...

AI工具箱8个月前

VidSketch

AIMv2

苹果公司推出的AIMv2是一款开源的多模态自回归预训练视觉模型。该模型结合图像和文本信息，通过创新的预训练框架，将图像和文本信息合并为一个统一的序列进行自回归预训练，增强了模型对多模态数据的理解能力。AIMv2提供多种参数规模的版本，适应各种设备，并在多模态任务和传统视觉任务中表现优异。 AIMv2...

AI工具箱8个月前

AIMv2

FLORA

FLORA是一款为设计师、创意工作者和内容创作者提供的AI创意工具平台，旨在通过节点式AI画布整合文本、图像和视频生成等多种功能，简化从故事构思到视觉内容创作的整个流程。用户能够迅速生成创意提示，并灵活搭建创意流程，从而实现高效的协作与迭代。 FLORA集成了多种创意工具的AI平台，专为设计师、创意...

AI工具箱8个月前

FLORA

Baichuan-Audio

百川智能推出的Baichuan-Audio是一款先进的端到端音频大语言模型，具备无缝音频理解与生成的能力，能够实现高质量、可控的实时中英文对话。该模型采用多码本离散化技术，成功将音频信号转化为离散标记，保留语义和声学信息，并通过音频处理模块增强音频特征的识别能力。Baichuan-Audio基于双阶...

AI工具箱8个月前

Baichuan-Audio

1 2 3 4