Skip to content

Instantly share code, notes, and snippets.

@nishio
Created March 28, 2025 03:42
Show Gist options
  • Save nishio/82918f0652a420352ccf84d67ce95562 to your computer and use it in GitHub Desktop.
Save nishio/82918f0652a420352ccf84d67ce95562 to your computer and use it in GitHub Desktop.

以下は、2025-03-20~2025-03-27の1週間に「digitaldemocracy2030/kouchou-ai」リポジトリで起きた主な出来事をかいつまんでまとめたものです。新機能やバグ対応が多数あり、プロジェクトが大きく進化しています。


1. まとめ: この1週間で何が起こったのか?

  1. 大規模なIssueクローズ(30件)

    • スプレッドシート連携の改善やクラスタ表示の調整など、多岐にわたる機能追加・改善が完了
    • 既存のバグ修正やリファクタリングで使い勝手が向上
  2. 新たに30件のIssueを立ち上げ

    • LLMを用いたクラスタ品質の自動評価やファクトチェック、グラウンディング手法の導入など、より高度な分析・可視化を実現するための提案が活発に行われている
    • CSVアップロードまわりの最適化やストレージ連携など、本番運用を見据えた話題が増加
  3. Azure・ストレージ関連の活性化

    • 「Azure上で運用し、かつAzure OpenAI Serviceを使いたい」という声が高まり、Azure Blob Storageへの永続化やAzure Container Apps/Container Instances対応が本格検討・実装されている
  4. UI・UXの改善要望が多数

    • 「濃いクラスタ」の表示やツリーマップでの件数表示など、利用者が理解しやすいデザインへの要望が多く取り上げられ、修正が続々完了
    • 「クラスタの説明文が同じになる」「Shift-JISの自動変換」など細かい使いやすさの改良も盛ん
  5. レポート管理強化とデータ活用

    • CSVを直接JSON変換せずアップロードしたい (#186)
    • レポートの中間成果物のZIPダウンロード機能やストレージ永続化など、実用度を高めるIssueが目白押し

2. 完了した主なIssueのトピック

スプレッドシート連携時の重複データ問題 (#184)

  • 内容: スプレッドシートからデータ取得後にレポートIDを変えるとコメントが二重保存される問題
  • 議論のポイント:
    • IDを変更不可にするか、不要データを自動削除するか
    • ディスク容量はそう大きくないため、削除の方向で調整か

ローカル環境へのデータ取得スクリプト (#179)

  • 内容: APIからレポート情報を引き出し、ローカルで動かせるようにする要望
  • 背景: 新環境に移行した際もレポートを簡単に再現できるようにする

dependabotの導入 (#151)

  • 内容: パッケージの脆弱性対応を自動化する提案
  • 利点: セキュリティ更新の負荷を下げ、安心して開発を継続できる

CSVアップロード時のバリデーションと文字コード対応

  • 複数のIssue: #124, #123, #147など
  • 概要: Shift-JISをUTF-8に自動変換、CSVの行数がクラスタ数より少ない場合の警告など、「使いやすい入力」へ向けた機能強化

Azure対応関連 (#94, #174 など)

  • 背景: 自治体や大企業での利用ニーズが高い
  • 動き:
    • Azure OpenAI Serviceを使う場合の設定
    • Azure Blob Storageでレポートを永続化する仕組み
    • コンテナ再作成時にレポートが消えないようにするノウハウ

3. 新たに立ち上がった注目Issue

LLMを使った高度な分析・評価

  • クラスタ品質の自動評価 (#143, #144)
    • LLMでクラスタの質をスコアリングし、悪いクラスタを検出する仕掛け
  • ファクトチェック機能 (#170)
    • 偽情報の排除や真偽判定の自動化
  • グラウンディングの実装 (#172, #173)
    • 「説明文にどの発言が根拠になっているか」をセットで示す

CSVをそのままサーバーに渡す機能 (#186)

  • 背景: フロントでJSONに変換すると大きなデータほど負荷が高い
  • 提案: CSVファイルをFormDataで直接APIに送る → サーバー側でそのまま処理

大規模データ・実運用に向けた強化

  • ストレージ連携でデータを残す (#174, #46)
    • コンテナ再起動してもレポートが消えないように
  • レポート失敗時の調査用ZIP取得 (#185)
    • 大量データでコケたときのトラブルシュートをやりやすくする

UI改善

  • より大きいサンプルデータの同梱 (#120)
    • 50件ではクラスタ分けが体感しづらい → 200件程度のサンプルを準備
  • 縦長画面での散布図表示 (#121)
    • Plotlyのレイアウトが崩れる問題に対応

4. 今後への期待

  • 「LLM活用」と「本番運用体制」の両面で進化

    • 既存のクラスタリングに加え、ファクトチェックやグラウンディング、品質評価などLLMを活かした高度分析機能が続々議論されている
    • Azure連携やストレージ永続化など、実際の業務で運用するための基盤強化が進む
  • 使いやすさ重視のUI改善

    • 文字コードやスプレッドシート対応の強化で、エンジニア以外も含めた幅広い利用を視野にした改良が期待される
  • 大規模データや複数レポート管理が一層簡単に

    • レポート取得スクリプトや失敗時のダウンロードZipなど、実務での分析フローがスムーズになる仕組みが整備されていきそう

5. プロジェクトへの興味を掻き立てるポイント

  1. 自治体・企業ユースを意識したAzure対応

    • 公的機関など大規模ユーザーにも使いやすいよう、ストレージ連携やAzure OpenAI Service対応が本格化
  2. LLMを活かした先進的な機能提案

    • クラスタ品質評価やファクトチェックなど「普通のアンケート集計」にはない新しい分析手法が登場
    • オープンソースで試せるのが魅力
  3. UIの細かい改善で導入障壁を下げる

    • CSVのShift-JIS自動変換、スプレッドシート連携など、ノンエンジニア層も含め「導入してすぐに使える」方向へ
  4. コミュニティでの活発な議論

    • 多数のIssueが立ち上がり、実装やレビューが高速で進むため、気軽に参加・提案しながらプロダクトを育てられる

まとめ

この1週間は、「使いやすさ」と「高度な分析機能」の両軸で大きく前進した印象です。自治体や企業にも導入しやすいAzure対応、レポート管理の充実、新たなクラスタ分析手法など多彩なアイデアが形になりつつあります。オープンソースでありながら最新のAI活用を取り込んでいく“広聴AI”は、今後もますます面白くなっていくはずです。ぜひリポジトリをチェックしてみてください!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment