AI工具

共 153 篇文章

Pinch

Pinch是一款创新的实时AI语音翻译视频会议平台,旨在消除语言障碍,支持超过30种语言的即时语音翻译。Pinch提供口译模式和同声传译模式,分别支持38种和32种语言,满足不同场景下高精度和高效率的需求。Pinch的核心优势在于无需字幕的自然流畅语音翻译,让用户更专注于交流。该平台支持多人视频通话...
AI工具箱9个月前
Pinch

Mistral OCR:快速准确识别文字的优秀工具

Mistral OCR 是 Mistral AI 最新推出的一款光学字符识别(OCR)工具,专为处理复杂文档而设计。该工具能够全面解析文档中的文本、图像、表格和数学公式,支持多种语言和字体,准确率高达99.02%。在各项基准测试中,Mistral OCR 的表现超越了 Google Document...
AI工具箱9个月前
Mistral OCR:快速准确识别文字的优秀工具

SpeciesNet

SpeciesNet是Google开源的一款人工智能模型,旨在分析相机陷阱拍摄的图像来识别动物物种。该模型基于超过6500万张图像进行训练,能够识别超过2000种标签,涵盖各种动物物种、分类单元以及非动物对象。SpeciesNet由MegaDetector和SpeciesNet分类器两个主要组件构成...
AI工具箱9个月前
SpeciesNet

DiffRhythm

DiffRhythm是由西北工业大学与香港中文大学(深圙)联合研发的一款先进的端到端音乐生成工具。它基于潜扩散模型技术,可快速生成包含人声和伴奏的完整音乐作品。用户只需输入歌词和风格提示,DiffRhythm就能在短短10秒内创作出最长达4分45秒的高质量音乐,显著提高了音乐创作效率,解决了传统生成...
AI工具箱9个月前
DiffRhythm

抓住平台商机:如何利用Platus实现商业增长?

Platus是一家专注于运用人工智能和无代码平台优化企业法律流程的创新法律科技初创企业。该平台为中小企业和法律团队提供高效且自动化的法律基础设施,涵盖了文件起草、审查、签署和公证等多项服务。用户可以通过直观的拖放界面快速构建和管理法律工作流,而AI工具则能自动识别重要条款和潜在风险,确保合规性。此外...
AI工具箱9个月前
抓住平台商机:如何利用Platus实现商业增长?

高效编辑文案:AVD2独家揭秘,新鲜资讯抢先知!

AVD2 是一个由清华大学与香港科技大学、吉林大学、南京理工大学、北京理工大学、复旦大学等多所机构共同开发的自动驾驶事故视频理解与生成框架。该框架旨在提高自动驾驶事故视频的理解能力,通过生成与详细自然语言描述相对齐的视频来增强对复杂事故场景的解析效果。AVD2整合了视频生成与事故分析技术,能够生成具...
AI工具箱9个月前
高效编辑文案:AVD2独家揭秘,新鲜资讯抢先知!

DeepTutor

DeepTutor是一款基于人工智能的智能辅导系统,旨在通过个性化的学习体验,帮助用户高效掌握复杂的学术内容。它能够深入理解多种类型的资料,包括文本、图表和公式等,并将复杂的学术或技术问题分解为易于理解的部分。用户可以通过上传各种文档(如PDF格式的课堂笔记、研究论文等),选择不同的模式(基本模式或...
AI工具箱9个月前
DeepTutor

TheoremExplainAgent(TEA)

TheoremExplainAgent(TEA)是由滑铁卢大学与Votee AI等机构联合开发的多模态智能代理系统。该系统旨在生成长达5分钟以上的动画教育视频,帮助用户更深入理解数学和科学定理。涵盖多个STEM领域,包括数学、物理、化学和计算机科学。为评估性能,团队推出了TheoremExplain...
AI工具箱9个月前
TheoremExplainAgent(TEA)

hyper-ugc

hyper-ugc是一款AI驱动的用户生成内容(UGC)视频创作平台,旨在帮助用户快速制作高质量的短视频。通过AI虚拟形象技术,hyper-ugc能够替代真人出镜,在TikTok、Instagram等多个社交媒体平台上进行视频制作。用户无需具备专业技能,只需简单操作即可在几分钟内创造引人注目的视频作...
AI工具箱9个月前
hyper-ugc

混元图视频

混元图生视频是由腾讯混元团队推出的一款开源图像生成视频模型,用户可上传一张图片并提供简要描述,即可生成时长为5秒的动态视频。该模型具备自动化口型匹配、动作驱动和背景音效生成等功能,适用于写实、动漫及CGI等不同类型的角色和场景,参数容量高达130亿。混元图生视频模型已在腾讯云上线,用户可通过混元AI...
AI工具箱9个月前
混元图视频

Probly

Probly 是一款创新的 AI 驱动电子表格工具,将电子表格的便捷性与 Python 数据分析的强大功能相结合。通过利用 WebAssembly 技术在浏览器中直接执行 Python 代码,Probly 支持用户进行交互式操作、数据可视化以及智能分析建议。用户可以轻松导入数据,并快速生成分析结果或...
AI工具箱9个月前
Probly

Fractal Generative Models

麻省理工推出的分形生成模型(Fractal Generative Models)是一种创新的图像生成技术,由麻省理工学院计算机科学与人工智能实验室与Google DeepMind团队共同研发。该模型基于分形理论,将生成过程抽象为可重用的“原子模块”,通过递归调用这些模块,构建出具有自相似特性的分形结...
AI工具箱9个月前
Fractal Generative Models

CogView4

CogView4是一款由智谱科技推出的开源文生图模型,拥有60亿个参数,能够支持中文输入和文字生成。在DPG-Bench基准测试中表现优异,综合评分排名第一,成为开源文生图模型领域的最新标杆。 这个模型支持中英双语输入,可以生成高质量的图像,也能够生成任意分辨率的图像,范围从512×512到2048...
AI工具箱9个月前
CogView4

Spark-TTS

Spark-TTS是一款由SparkAudio团队推出的AI文本转语音工具,支持中英文零样本语音克隆。该工具基于大型语言模型(LLM)构建,能够在没有额外生成模型的情况下,直接通过LLM预测的编码重建音频,实现零样本文本到语音的转换。用户可以通过调节参数(如性别、音调、语速等)来生成符合个性化需求的...
AI工具箱9个月前
Spark-TTS

SepLLM

SepLLM – 分隔符压缩加速大语言模型的高效框架 SepLLM简介 SepLLM是香港大学和华为诺亚方舟实验室等机构共同研发的高效框架,旨在加速大型语言模型(LLM)的推理过程。SepLLM通过有效地压缩段落信息并消除冗余标记,显著提高了模型的推理速度和计算效率。该框架的关键创新在于利用分隔符(...
AI工具箱9个月前
SepLLM

LCVD

LCVD是四川大学推出的一款名为“光照可控视频扩散模型”(Lighting Controllable Video Diffusion Model)的肖像动画生成框架。该框架能够高保真地生成具有可控光照效果的肖像动画,通过将肖像的内在特征(如身份和外观)与外在特征(如姿态和光照)进行分离,并使用参考适...
AI工具箱9个月前
LCVD

海螺视频APP

海螺视频APP是MiniMax推出的一款AI视频生成工具,通过人工智能技术帮助用户轻松制作高质量的视频内容。该应用支持文字生成视频(T2V)和图像生成视频(I2V)功能,用户只需输入文本或上传图片,即可生成生动的动态视频。海螺视频APP独特之处在于其“镜头控制”功能,提供多种镜头效果,并支持用户自定...
AI工具箱9个月前
海螺视频APP

Alexa+

亚马逊推出了一款名为Alexa+的新一代智能助手,采用了先进的云生成式AI技术,提供了全面升级。Alexa+通过高效的架构将大规模语言模型、代理功能、各种服务和设备紧密连接,实现了更自然、智能和个性化的对话体验。用户可以与Alexa+进行流畅的自然语言交流,完成多样化的任务,包括智能家居控制、餐厅预...
AI工具箱9个月前
Alexa+

WhisperChain

WhisperChain 是一款AI实时语音转文字工具,旨在提高工作效率。该工具利用 Whisper.cpp 实现实时语音转文本功能,并结合 LangChain 对文本进行清理和优化,去除冗余词汇,编辑和精炼内容。此外,WhisperChain 提供全局快捷键功能,用户可随时启动语音输入,将清理后的...
AI工具箱9个月前
WhisperChain

飞书知识问答平台

飞书知识问答是飞书智能办公平台推出的一款高效的知识管理与问答工具,旨在帮助企业提高信息获取速度和知识共享效率。借助先进的人工智能技术,该工具支持实时联网搜索和多种文件格式的解析,可以连接多种数据源,包括本地文档、飞书云文档以及企业业务系统,迅速生成简明、结构化的答案。 该工具的核心功能包括智能问答、...
AI工具箱9个月前
飞书知识问答平台

WarriorCoder

WarriorCoder是华南理工大学计算机科学与工程学院与微软合作推出的一款代码生成大语言模型(LLM)。其创新之处在于模拟不同专家模型之间的对抗,以生成高质量的训练数据,从而显著提升模型的性能。与传统方法不同,WarriorCoder摒弃了对现有专有模型或数据集的依赖,而是采用从零开始挖掘指令的...
AI工具箱9个月前
WarriorCoder

WorldCraft

WorldCraft是香港科技大学开发的3D虚拟世界创建和定制系统,利用大型语言模型代理技术,帮助用户构建个性化的3D虚拟环境。用户可以通过自然语言交互轻松生成复杂的室内外场景,并对场景中的物体和布局进行精细的调整。WorldCraft包含ForgeIt、ArrangeIt和轨迹控制模块,用于物体定...
AI工具箱9个月前
WorldCraft

GPT-4.5强大升级版

GPT-4.5是OpenAI最新推出的旗舰语言模型,具有卓越的性能。其采用了扩展的无监督学习方法,显著提升了模式识别、知识广度和创意生成能力,同时降低了虚假信息的输出,使得模型生成的对话更加自然并贴近人类交流习惯。GPT-4.5具备丰富的知识库、高度的情感智能和对用户意图的准确理解,适用于广泛的场景...
AI工具箱9个月前
GPT-4.5强大升级版

IndexTTS

IndexTTS 是 B 站推出的文本转语音模型,它结合了 XTTS 和 Tortoise 模型的先进技术,采用了 GPT 风格的生成技术。这个系统在将文本转换为自然流畅的语音方面表现出色,尤其擅长处理中文文本。IndexTTS 不仅支持拼音纠正汉字发音,还可以利用标点符号来精准控制停顿,有效解决多...
AI工具箱9个月前
IndexTTS

Flame

Flame是一款开源的多模态AI模型,专为将UI设计截图转化为高质量的现代前端代码而设计。该模型利用视觉语言建模、自动化数据合成以及结构化训练流程,能够生成符合React等现代前端框架标准的代码,支持组件化、状态管理及动态交互功能。相较传统模型仅生成静态代码的方式,Flame采用创新的数据合成方法,...
AI工具箱9个月前
Flame

TinyR1-Preview

奇虎360与北京大学联合推出了TinyR1-Preview,这是一款推理模型,参数量为32B。该模型以低参数量实现了类似Deepseek-R1-671B的性能。在数学领域(AIME评测),TinyR1-Preview的得分为78.1,接近于原版R1(79.8分),远超过70B的Deepseek-R1...
AI工具箱9个月前
TinyR1-Preview

DeepGEMM

DeepGEMM是DeepSeek开发的开源库,旨在提供高效且简洁的FP8矩阵乘法(GEMM)功能。此库特别针对NVIDIA Hopper架构的张量核心进行优化。除了支持常规的GEMM操作外,DeepGEMM还能够在混合专家(MoE)模型中进行分组矩阵乘法操作。其采用即时编译(JIT)技术,在运行时...
AI工具箱10个月前
DeepGEMM

VLM-R1

VLM-R1是浙江大学Om AI Lab推出的一款视觉语言模型,采用强化学习技术。该模型可以根据自然语言指令精确定位图像中的目标物体,例如根据描述"图中红色的杯子"找到对应图像区域。VLM-R1建立在Qwen2.5-VL架构基础上,结合了DeepSeek的R1方法,通过强化学习优化与监督微调(SFT...
AI工具箱10个月前
VLM-R1

Claude Code

Anthropic推出的智能编程工具——Claude Code,是一款具备多项功能的工具。目前处于研究预览版的阶段,通过自然语言命令帮助开发者更高效地进行编码,完美融入现有开发环境,无需额外配置。 Claude Code的主要功能包括: 代码搜索与阅读; 文件编辑与修改; 编写与运行测试; 提交与推...
AI工具箱10个月前
Claude Code

SigLIP 2:全新版本发布!

SigLIP 2是由谷歌DeepMind推出的先进的多语言视觉-语言模型,是SigLIP的升级版本,其强化了图像与文本之间的对齐能力。通过创新的训练方法和架构,SigLIP 2在多语言理解、零样本分类以及图像-文本检索等任务中表现出卓越性能。 SigLIP 2具有以下主要功能: 多语言支持:能够处理...
AI工具箱10个月前
SigLIP 2:全新版本发布!

Moonlight-16B-A3B

Moonlight-16B-A3B是Moonshot AI开发的一款创新型Mixture-of-Expert(MoE)模型,拥有160亿总参数和30亿激活参数。使用优化后的Muon优化器进行训练,计算效率为传统AdamW的两倍。在英语语言理解(MMLU)和代码生成(HumanEval)等任务中表现出...
AI工具箱10个月前
Moonlight-16B-A3B

FlashMLA

FlashMLA是DeepSeek开源的高效MLA(多头线性注意力)解码内核,专为NVIDIA Hopper架构GPU进行优化。该产品通过优化KV缓存机制和采用BF16数据格式,提升了内存和计算效率。在H800 SXM5 GPU上,FlashMLA可实现高达3000GB/s的内存带宽和580TFLO...
AI工具箱10个月前
FlashMLA

Argon

Argon是一款专注于制药、生物技术和生命科学领域的智能解决方案平台,致力于提升临床开发的自动化水平。该平台运用自然语言处理技术和专有数据库,能够快速分析临床试验数据,生成治疗领域的深刻洞察,并自动化繁重的数据处理任务,从而显著减少药物开发所需的时间和成本。 Argon的主要功能包括: AI驱动的洞...
AI工具箱10个月前
Argon

Llasa TTS

Llasa TTS是香港科技大学开发的一款基于LLaMA架构的开源文本转语音(TTS)模型。这一模型采用高质量的语音合成和克隆技术,在训练和推理阶段表现出色,并支持情感表达、音色克隆等多种功能。Llasa TTS提供不同参数规模的模型,包括1B、3B和8B,能够生成多语言合成。 主要功能包括高质量语...
AI工具箱10个月前
Llasa TTS

问小白AiPPT

问小白AiPPT是一款由问小白推出的智能演示文稿生成工具,能够通过简单的操作快速创建PPT。用户只需输入相应的大纲或需求,系统即可迅速生成完整的PPT文件,并支持免费下载。该工具基于DeepSeek R1 671B满血版,具备稳定性和快速响应能力,目前完全免费,非常适合需要快速制作演示文稿的用户,在...
AI工具箱10个月前
问小白AiPPT

Sitcom-Crafter

《Sitcom-Crafter》是北京航空航天大学、香港中文大学(深圳)、悉尼科技大学和中山大学等多所高校共同研发的一款3D场景人类动作生成系统。该系统根据用户提供的剧情引导,能够智能生成丰富多样、符合物理规律的动作表现,包括人类行走、人与场景的互动以及人类之间的交互。八个模块构成了《Sitcom-...
AI工具箱10个月前
Sitcom-Crafter

流畅阅读开源的浏览器翻译插件

“流畅阅读”是一款开源的浏览器翻译插件,旨在为用户提供近乎母语水平的阅读体验。该插件依托先进的人工智能技术,支持多种翻译引擎,包括传统机器翻译和AI大模型翻译,同时允许用户自定义翻译服务。其核心功能包括智能翻译、双语对照显示以及数据在本地存储以确保用户隐私安全。 在“流畅阅读”中,用户可以选择不同的...
AI工具箱10个月前
流畅阅读开源的浏览器翻译插件

AI辅助写作是否能提升高校论文质量?知乎上对此如何看待?

随着人工智能(AI)技术的迅猛发展,AI写论文辅助工具逐渐成为学术界和科研领域热门话题。就使用这类工具是否容易引发抄袭问题,知乎上出现了各种不同观点。 部分网友担忧,使用AI写论文工具可能增加论文抄袭的风险。他们认为,AI工具会直接提供论文段落或素材,使用者若不小心便可能将这些内容直接复制进自己的论...
AGI2年前
AI辅助写作是否能提升高校论文质量?知乎上对此如何看待?

AI免费写论文,利大于弊?(深度分析AI撰写论文的优势与劣势)

在数字化时代,人工智能(AI)在各个领域都得到了广泛应用,其中之一便是辅助写作。近年来,越来越多的学生和学者开始利用AI工具免费撰写论文。这一现象引发了许多讨论。尽管AI免费写论文确实有其优势,但也存在一些潜在的弊端。 AI免费写论文的最大优势在于效率。相对于人工写作,AI能够在短时间内生成大量文字...
AGI2年前
AI免费写论文,利大于弊?(深度分析AI撰写论文的优势与劣势)

AI技术在论文查重中的应用及局限性

随着人工智能技术的快速发展,AI写论文查重工具已经被广泛运用于学术领域。这种工具不仅可以提高论文查重的效率和准确性,而且也存在一些局限性。 AI写论文查重工具通过自动比对大量文献数据库和互联网资源来检测论文中的重复或抄袭内容。相较于传统的人工查重方法,AI技术具有更快的查重速度和更准确的结果。这对于...
AGI2年前
AI技术在论文查重中的应用及局限性
1 2 3 4