テキストマイニング練習サイト

Webスクレイピングとテキスト解析の学習用コンテンツ

📚 物語

生成AIによる創作物語集。感情分析、文体分析、テキスト分類などの練習に適したコンテンツです。

物語ページへ

📰 仮想ニュース

架空のニュース記事を集めたページ。記事の分類、トピックモデリング、要約生成などの実践的な練習ができます。

ニュースページ(準備中)

学習のポイント

  • 基本的なスクレイピング: BeautifulSoup、requestsライブラリの使用方法
  • データ抽出: CSSセレクタ、XPathの活用
  • テキスト前処理: 正規表現、文字列操作
  • 形態素解析: MeCab、janomeを使った日本語処理
  • データ保存: CSV、JSON、データベースへの保存
注意事項: このサイトは学習目的で作成されています。実際のWebサイトをスクレイピングする際は、robots.txtの確認、利用規約の遵守、適切なアクセス頻度の設定を心がけてください。