音声認識技術を活用して音声データを自動的に文字起こしを行い、Webアプリ上で結果を表示するツールです。会議録の作成や講義の記録など、効率的な文字起こしをサポートする。
・リアルタイム音声認識: 録音中の音声を即座に文字起こし
・メモ:メモを残せる
・esaと共有:内容をesaと共有できる
種類 | 技術・ライブラリ | バージョン | 説明 |
---|---|---|---|
プログラミング言語 | Python | 3.9以上 | プロジェクト全体で使用する主要な言語 |
フロントエンド | JavaScript | ES6以上 | Webアプリケーションの動的部分を担当 |
フレームワーク | Flask | 2.1.3 | Webアプリケーションフレームワーク |
リアルタイム通信 | Flask-SocketIO | 5.3.1 | WebSocket通信をサポートするライブラリ |
音声処理 | SpeechRecognition | 3.10.0 | マイクから音声をキャプチャするライブラリ |
・Pythonのインストール
Python 3.9以上を以下のURLからインストールしてください
・ライブラリのインストール
以下のコマンドでインストールするか、requirements.txt に記載してください。
pip install flask flask-socketio pyaudio SpeechRecognition requests
以下のコマンドで起動する
python run.py
ローカルサーバーにアクセスする。デフォルトは以下のURLである
http://127.0.0.1:5000
start:録音を開始する
stop:録音を停止する
save to esa:esaに保存する