一応フォローしつつもアクツクMVへの愚痴が止まらねえ!―みんなのci-enまとめvol144
2012年からDL同人エロゲの感想アフィを続けて来た私(111)ですが、昨今のこの業界は百花繚乱、ますます円熟の道を歩みつつある様に感じられる。
万DLを叩き出すいわゆるトップクリエイター、遊ぶ専門のユーザー、あるいはその狭間にぶらぶらと位置する層。
そこで色んなクリエイターのci-enや制作に役立つ情報を横断し、今の位置を跳び越えよう、それが新しい裾野になるし、もしかしたら一攫千金のチャンスもあるかも? という企画なのだ
クリエイターズ申請(1000ptもらえる)目当てにDLチャンネルに投稿したので、審査が降りたらここにリンクを貼る:
テキストか、ポッドキャストの音声で聞くか、そういう所はある
最近やってること
最近、DL数300くらいでもレビュー数0件、DLチャンネルの「関連まとめ」0件という作品がそこそこ見受けられるので、
それならと、自分の体験版ゲーム実況からDLチャンネルへ投稿する記事を半自動で生成、せめてものご参考にして下さい、というのを考える。
1.ゲーム実況(動画)
↓
2.何を言ってるかAI音声認識でテキスト化
↓
3.動画を場面ごとに画像として切り出す
↓
4.時系列に合わせて画像にテキストを当て嵌める
↓
5.それを更にAIに掛け、テキストをもうちょっと面白い感じにしたい
という、AI頼みのやり方。
これがAI新時代だっ!
実はもう現時点で3.くらいまでは出来てるのだが、まぁ精度が悪いねえ…。
2はwhisperで認識させてるのだが、この音声認識ライブラリの精度が高いのは、文脈でもって喋ってる事を判断するからであって。
まぁそこで来たら元々ゲーム実況なんて、「ゲーム画面を見ながら喋ってる」って文脈が共有されないと本当に突拍子の無い事を言ってるんだから……ダメですねえ…
3.はffmpegの標準機能であったが……
「前のシーンからの変化度」が基準であって、ゲームではちょっと派手なエフェクトが爆発したらこれまた精度ズタボロに…
5.はローカルLLMであるところのollama 3 というのを試したら、日本語で校正してねってお願いしても、英語で返して来やがる!
普通にchatGPTより精度悪いように思われ……、だいいち音声認識の時点であんまりマトモにテキスト化出来てないので、タカが知れておる…
AI、とりあえず触る事は出来ても、そこから精度を上げるってのが数十倍は大変ってあるよね…
うーんこれ、頑張っても使い物にならねえかも……。
結局一番いいのは、LLMに動画を放り込み、「この動画はゲーム実況をしています。喋ってる内容を画像とテキストのセットにして、順次出力して下さい」
が出来れば一番文脈も考慮できて良いんだと思うけど、これ出来るLLM……あるかなあ…
ツール・素材系アフィ
そんな訳でこれを見てる人の多くは、明日の有名クリエイターを目指し、制作を続けておられる方でしょう。
DLsiteで扱ってるツールやら素材のリンクを貼っておきますね……↓
[ゲームエフェクト集 Vol1 サファイアソフト素材シリーズ]
ディスカッション
コメント一覧
まだ、コメントがありません