图龙网络科技

问答社区

原创作者: 图龙网络科技 发布时间: 2023-09-23 229.8K 人阅读

FunASR 和 Qwen2 构建的音视频转结构化笔记系统

图龙网络科技 发布于 3个月前 分类:语言模型

基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统

能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读

FunASR: https://github.com/modelscope/FunASR

Qwen2: https://ollama.com/library/qwen2

效果展示:

音视频识别和整理1723877147-c4ca4238a0b9238

与音视频内容对话

1723877177-b09161865535a1c

使用方法

① 安装 Ollama

下载对应系统的 Ollama 安装包进行安装

https://ollama.com/download

② 拉取模型

我以 阿里的千问2 7b 为例 https://ollama.com/library/qwen2

ollama pull qwen2:7b

③ 部署服务

有两种部署方式,一种是使用 Docker 部署,另一种是本地部署

Docker部署(推荐)🐳

curl -fsSL https://github.com/harry0703/AudioNotes/raw/main/docker-compose.yml -o docker-compose.yml
docker-compose up

docker 启动后,访问 http://localhost:15433/

登录账号为 admin,密码为 admin (可以在 docker-compose.yml 文件里面修改)

本地部署 :

需要有可访问的 postgresql 数据库

conda create -n AudioNotes python=3.10 -y
conda activate AudioNotes
git clone https://github.com/harry0703/AudioNotes.git
cd AudioNotes
pip install -r requirements.txt

将 .env.example 重命名为 .env,修改相关配置信息

chainlit run main.py

服务启动后,访问 http://localhost:8000/

登录账号为 admin,密码为 admin (可以在 .env 文件里面修改)

0个回复

  • 龙族们都在等待回复

提供中小企业建站高端正版精品系统

正品模板 购买协议