レシートにタグ付けをする仕組みの開発
2026.02.26
導入背景・課題
ある会社が、消費者のレシートを集めてデータ解析し、飲食店や小売店にデータ販売していた。この際に、レシートの各行が何を購入したものかをタグ付けする必要があり、この会社で自動タグ付けする仕組みを開発し、タグ付けを行っていた。しかし、このタグ付けの精度を十分に高められていなかった。
解決策
まずはこの会社が開発した自動タグ付けの仕組みによるタグ付け結果のエラー原因を分析し、よくタグ付けに失敗しているパターンを整理し、発生頻度が高い順に対処を行った。
自動でタグ付けされた結果と、過去から蓄積されている商品情報とタグのペアを用いた機械学習的なアプローチと、文章を意味を持つ最小単位(形態素)に分割する形態素解析を用いたルールベースでのアプローチを組み合わせることで、タグ付けの精度を高めた。
自動でタグ付けされた結果と、過去から蓄積されている商品情報とタグのペアを用いた機械学習的なアプローチと、文章を意味を持つ最小単位(形態素)に分割する形態素解析を用いたルールベースでのアプローチを組み合わせることで、タグ付けの精度を高めた。
効果
全体のタグ付けの正解率を+10%程度引き上げた。このことで、これまでのタグ付けで見逃されやすかった数の少ない商品分類の精度が改善し、小さなトレンドの変化を捉えやすくなり、販売データとしての価値向上が期待される。