AudioNotes：AI音频转文字工具快速提取音视频内容并转成Markdown笔记

AudioNotes是什么

AudioNotes 是一款 AI 音频转文字工具，基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统，能够快速提取音视频内容，并调用大模型进行整理，生成结构化的 Markdown 笔记，便于快速阅读。AudioNotes核心功能是利用先进的自动语音识别（ASR）技术，能够精准提取音视频中的文本内容，通过大模型整理生成清晰易读的 Markdown 笔记，并支持用户与音视频内容进行交互式对话以获取更多信息。目前AudioNotes有两种部署方式，一种是使用 Docker 部署，另一种是本地部署，推荐使用Docker部署。

AudioNotes效果展示

音视频识别和整理

与音视频内容对话

AudioNotes如何使用

① 安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download

② 拉取模型

以
阿里的千问2 7b
为例

https://ollama.com/library/qwen2

ollama pull qwen2:7b

③ 部署服务

有两种部署方式，一种是使用 Docker 部署，另一种是本地部署

Docker部署（推荐）?

curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后，访问

http://localhost:15433/

登录账号为 admin，密码为 admin （可以在 docker-compose.yml 文件里面修改）

本地部署 ?

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

将
.env.example
重命名为
.env
，修改相关配置信息

chainlit run main.py

服务启动后，访问

http://localhost:8000/

登录账号为 admin，密码为 admin （可以在 .env 文件里面修改）

AudioNotes GitHub地址

网站：

https://github.com/harry0703/AudioNotes