AI-Media2Doc：AI 视频图文创作助手一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档

产品概述

AI-Media2Doc是一款

AI 视频图文创作助手

，能够在无需登录注册、纯前端运行的前提下，将任意视频或音频内容，

一键将视频和音频转化为小红书/公众号/知识笔记/思维导图等各种风格的文档

。用户可在浏览器端直接处理音视频文件，并导出生成的思维导图到第三方平台进行进一步编辑和调整，无需任何付费或账号绑定。

核心功能

多风格文档输出

支持小红书风格的社交图文笔记。
输出适合公众号传播的深度文章。
生成结构化的知识笔记，便于学习与复盘。
自动构建思维导图，理清内容脉络。

本地化、开源、零依赖

MIT 协议开源，可自由部署到本地环境。
纯前端处理方案（基于 ffmpeg wasm），无须安装 ffmpeg。
所有任务记录保存在本地，不上传至第三方云平台，保证隐私安全。

AI 二次对话

针对视频内容发起智能对话，可细化补充或深入提问，优化总结质量。

技术亮点

前端音视频处理

利用 WebAssembly 版本的 ffmpeg 在浏览器中完成音视频的解码、编码与剪辑，摆脱后端依赖和服务器压力。

思维导图导出

生成的思维导图支持导出为兼容多种在线免费平台的格式，用户可在喜爱的工具中继续调整和完善。

未来规划

增加智能截帧功能，实现图文并茂的内容呈现。
集成 fast-whisper 本地大模型，提升语音识别精度并进一步降低成本。
优化前端界面设计，打造更优雅的用户体验。
支持 Docker 一键部署，简化运维流程。

应用场景

知识工作者：将长视频课程快速转化为清晰笔记，便于复习整理。
自媒体运营：一键生成符合平台调性的文案，省时高效。
团队协作：多人共同编辑思维导图，提升内容创作效率。
学习者：将听课或演讲录音转换为结构化文档，更快获取精华。

使用指南

打开网页，将视频或音频文件拖拽至上传区域。
选择输出文档风格（小红书/公众号/知识笔记/思维导图）。
等待 AI 处理完成后，点击下载或导出到第三方平台。

以上功能均已在浏览器端实现，零门槛体验，自由定制，让信息处理更高效、更安全。

如何使用/项目地址

GitHub：

https://github.com/hanshuaikang/AI-Media2Doc