Artwork

コンテンツは Koukichi Takahashi によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Koukichi Takahashi またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal
Player FM -ポッドキャストアプリ
Player FMアプリでオフラインにしPlayer FMう!

【自作アプリで効率化】AIでリアルタイム文字起こし&分析テスト!音声収録&ポッドキャスト投稿 – Google AI Studio

8:14
 
シェア
 

Manage episode 489031582 series 3281146
コンテンツは Koukichi Takahashi によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Koukichi Takahashi またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

今回はポッドキャスト収録そして配信の効率化のためにGoogle AI Studioを使って開発したアプリを試してみました。

既存サービスを使うのと大して変わらない気もしますが、重要なのは自分の好みに合わせて機能を追加したりカスタマイズできること。今回正常に使えたので、もろもろ追加していこうと思います。何かのヒントや参考になれば嬉しいです。

  • 00:00 - 自作ツールの試用開始
  • 00:20 - 過去のリアルタイム文字起こしツールの経験 (Pixel, iOS)
  • 00:45 - Google AI Studio製リアルタイム文字起こしツールの紹介
  • 01:15 - PCでの音声入力と文字起こしの方法論
  • 01:45 - 自作ツールの目的:自分用の議事録ツール
  • 02:15 - ツールの録音機能とキーワード設定(「声に偏る世界線」)
  • 03:00 - 録音停止/一時停止とデータ形式(webM)の問題
  • 03:25 - 録音後の処理:文字起こし、要約、ハッシュタグ、翻訳、検索置換
  • 03:55 - ツールの試用状況とリアルタイム表示
  • 04:40 - 最終的な出力画面について
  • 05:05 - 重大なトラブル:本命の録音を忘れていた
  • 05:50 - webM形式の音声データへの対応
  • 06:10 - 音質についての考察
  • 06:25 - 今回エピソードのまとめとポッドキャスト関連情報
  • 07:05 - エンディング

このテキストは、ポッドキャスト収録の効率化を目指し、リアルタイム文字起こし・分析ツールの自作とテストについて述べています。

音声コンテンツから即座にテキストを得る重要性を強調し、Google AI Studioを用いて専用ツールを開発中であることを報告。過去の文字起こし機能(Pixel、iOS)や自身の音声入力経験に触れつつ、開発中のツールには固有名詞のキーワード設定(例:「声に偏る世界線」も設定)による認識精度向上、録音後の文字起こし、要約、タグ付け、翻訳、置換などの機能が実装されていると説明しています。音声データの形式に課題(webm)はあるものの、実用化を進めており、メイン番組での活用も視野に入れている状況を報告しています。

※最終的にオンラインツールでWebMからMP3へ変換(AuditionもHandBreakもMedia Encorderも処理不可・・・)してAdobe Auditionで編集しました。

#声に偏る世界線 #リアルタイム文字起こし #GoogleAIStudio #Podcast #音声入力 #文字起こし #時短 #効率化 #ライフハック #ポッドキャスト #音声配信

※当サイトではGoogle Adsense/Amazonアソシエイト他、各種ASPによるアフィリエイト広告リンクを含む場合があります。

  continue reading

26 つのエピソード

Artwork
iconシェア
 
Manage episode 489031582 series 3281146
コンテンツは Koukichi Takahashi によって提供されます。エピソード、グラフィック、ポッドキャストの説明を含むすべてのポッドキャスト コンテンツは、Koukichi Takahashi またはそのポッドキャスト プラットフォーム パートナーによって直接アップロードされ、提供されます。誰かがあなたの著作物をあなたの許可なく使用していると思われる場合は、ここで概説されているプロセスに従うことができますhttps://ja.player.fm/legal

今回はポッドキャスト収録そして配信の効率化のためにGoogle AI Studioを使って開発したアプリを試してみました。

既存サービスを使うのと大して変わらない気もしますが、重要なのは自分の好みに合わせて機能を追加したりカスタマイズできること。今回正常に使えたので、もろもろ追加していこうと思います。何かのヒントや参考になれば嬉しいです。

  • 00:00 - 自作ツールの試用開始
  • 00:20 - 過去のリアルタイム文字起こしツールの経験 (Pixel, iOS)
  • 00:45 - Google AI Studio製リアルタイム文字起こしツールの紹介
  • 01:15 - PCでの音声入力と文字起こしの方法論
  • 01:45 - 自作ツールの目的:自分用の議事録ツール
  • 02:15 - ツールの録音機能とキーワード設定(「声に偏る世界線」)
  • 03:00 - 録音停止/一時停止とデータ形式(webM)の問題
  • 03:25 - 録音後の処理:文字起こし、要約、ハッシュタグ、翻訳、検索置換
  • 03:55 - ツールの試用状況とリアルタイム表示
  • 04:40 - 最終的な出力画面について
  • 05:05 - 重大なトラブル:本命の録音を忘れていた
  • 05:50 - webM形式の音声データへの対応
  • 06:10 - 音質についての考察
  • 06:25 - 今回エピソードのまとめとポッドキャスト関連情報
  • 07:05 - エンディング

このテキストは、ポッドキャスト収録の効率化を目指し、リアルタイム文字起こし・分析ツールの自作とテストについて述べています。

音声コンテンツから即座にテキストを得る重要性を強調し、Google AI Studioを用いて専用ツールを開発中であることを報告。過去の文字起こし機能(Pixel、iOS)や自身の音声入力経験に触れつつ、開発中のツールには固有名詞のキーワード設定(例:「声に偏る世界線」も設定)による認識精度向上、録音後の文字起こし、要約、タグ付け、翻訳、置換などの機能が実装されていると説明しています。音声データの形式に課題(webm)はあるものの、実用化を進めており、メイン番組での活用も視野に入れている状況を報告しています。

※最終的にオンラインツールでWebMからMP3へ変換(AuditionもHandBreakもMedia Encorderも処理不可・・・)してAdobe Auditionで編集しました。

#声に偏る世界線 #リアルタイム文字起こし #GoogleAIStudio #Podcast #音声入力 #文字起こし #時短 #効率化 #ライフハック #ポッドキャスト #音声配信

※当サイトではGoogle Adsense/Amazonアソシエイト他、各種ASPによるアフィリエイト広告リンクを含む場合があります。

  continue reading

26 つのエピソード

すべてのエピソード

×
 
Loading …

プレーヤーFMへようこそ!

Player FMは今からすぐに楽しめるために高品質のポッドキャストをウェブでスキャンしています。 これは最高のポッドキャストアプリで、Android、iPhone、そしてWebで動作します。 全ての端末で購読を同期するためにサインアップしてください。

 

クイックリファレンスガイド

探検しながらこの番組を聞いてください
再生

OSZAR »