ユニバーサルナレッジの前川です。

前回、ゼロマッチ解消テクニックである「フォールオフ」について紹介しました。ゼロマッチ時に検索条件を自動的に変更してマッチングを試みる手法です。

実際には、ゼロマッチは複合的な条件で起きる場合もあります。ひとつのフォールオフだけではなく、複数のフォールオフを組み合わせ、条件を変えて再検索を行うことでゼロマッチ解消の可能性が高まります

連続フォールオフと私たちは呼んでいます。

たとえば誤字クエリーで検索してゼロマッチになった場合、下図のように5回ものリトライ検索を行うことも可能です。

ゼロマッチページを表示する前に何ができるか。リトライ検索できるマッチングロジックは何かを考えてみてください。

– – –
ユニバーサルナレッジは、ECサイト専用 商品検索エンジンの提供のほか、検索UIのコンサルティングも行っています。こちらのFacebookページで最新情報をお届けしているので、フォローいただけると幸いです。
http://www.facebook.com/universal.knowledge.inc

こんにちは。ユニバーサルナレッジの前川です。

「お探しの商品は見つかりませんでした」というゼロマッチ ―― お客様を検索半ばで路頭に迷わせるネガティブな検索体験です。そのゼロマッチを解消する「フォールオフ」を紹介します。

フォールオフは、ゼロマッチページを表示する前にマッチングロジックや検索条件を自動的に変更して再検索を試みる手法です。

サーチエンジン側で自動的にあの手この手で検索条件を変更するので、お客様の手をわずらわせることなくゼロマッチを解消・回避することができます。

以前紹介したとおり、ゼロマッチにはさまざまな原因がありますが、対応するフォールオフも複数存在します。

順に説明しましょう。

1. カテゴリ指定を解除して検索
特定のカテゴリを指定した状態ではマッチする商品が見つからなくても、別のカテゴリを対象に再検索することで商品が見つかることがあります。指定カテゴリより上位のカテゴリを順に検索し直すフォールオフです。

2. スペラーの訂正クエリーで検索
「もしかして ●● ですか」と、訂正クエリーを提示する機能をスペラーと呼びます。ゼロマッチクエリーがスペラー辞書に引き当たった場合は、訂正クエリーで自動的に再検索するフォールオフです。

3. 検索対象データを拡張して検索
デフォルトでは検索対象にしていない商品データにまで広げて再検索するフォールオフです。
たとえば、「商品説明文」をデフォルトで検索対象としない方針の場合に有効です。ゼロマッチが起きた時だけ「商品説明文」を自動的に検索対象にします。

4. 検索方式を変更して検索
形態素解析で作ったインデックスと、nグラムで作ったインデックスではマッチする文字列が異なります。基本的には、クエリーとの相関性が高いのは形態素解析によるインデックスですので、同じ商品データに対して形態素解析とnグラム両方でインデクシングを行っておき、デフォルトでは形態素解析のインデックスフィールドを選択し、それではマッチしないときにnグラムのフィールドを検索するフォールオフです。

5. クエリーの一部を削除して検索
「A B C」のような文字間にスペースが入っている複合語クエリーの場合、Cを削除して「A B」で検索したり、Aを削除して「B C」で検索し直すフォールオフです。

たとえば、オリジナルクエリーが「A B」のように2単語の場合は、クエリー「A」だけの検索結果と、クエリー「B」だけの検索結果を個別に表示します。なお、複数の検索結果を表示するのでファセットUIは不要になることに注意しましょう。

オリジナルクエリーが「A B C」のように3単語の場合は、最大で6通りのクエリー候補があります(A B、B C、A C、A、B、C)。4単語以上になると組み合わせパターンが多くなってきますが、計算処理数が多くなり検索結果を返却するパフォーマンスにも影響が出てくる可能性がありますので、組み合わせパターンに制限をつけてもいいと思います※1 ※2。

いかがでしょうか。

フォールオフはサーチエンジン側の努力でゼロマッチページを極力出さないようにできるのです。

フォールオフは「転ばぬ先の杖」のようなもの。どんな杖をお客様にご用意差し上げられるのか、ぜひ検討してみてください。

つづく

– – –
※1:クエリー部分削除フォールオフはクエリーのリライト・置き換えといえる方法なので、本来の検索意図とずれる可能性はあります。しかしながら、次のアクションへの動線を提示できるので、単にゼロマッチ画面を表示するよりもネガティブな印象は薄まります。

また、できることなら本来の検索意図に近い組み合わせのクエリーを生成したいものです。どの組み合わせが良いかはゼロマッチクエリーを分析すると見えてきます。3単語で構成されるクエリーであれば、どの単語が主題を表すものかを分析します。

私たちの経験では、2単語で構成されるクエリーはどちらともいえませんでした。しかし、3単語以上のクエリーでは、1単語目と2単語目が主題を表すことが多く、つまり、お客様はクエリー作成時に主題となる単語をはじめに入力する傾向があるということが分かっています。3単語以上のクエリーでは組み合わせパターンが多くなり、すべての組み合わせの結果を出しにくいものです。したがって、単純にランダムに組み合わせるのではなく、1単語目と2単語目を起点にしたクエリーにしましょう(元のクエリーが「A B C D」であれば、A+X、B+X)。

※2:スペースで分けられた単語を削除する方式ではなく、形態素解析での区切り(トークン)単位で削除を行う方法もあります。この方式であれば1単語だけのクエリーでも部分削除フォールオフを行うことができます。ただし、単語の区切り方は形態素解析辞書に依存するため、意味不明なクエリーに置き換えられてしまう可能性が高くなります。あまりおすすめはしない方式ですが、紹介しておきます。
– – –
ユニバーサルナレッジは、ECサイト専用 商品検索エンジンの提供のほか、検索UIのコンサルティングも行っています。こちらのFacebookページで最新情報をお届けしているので、フォローいただけると幸いです。
http://www.facebook.com/universal.knowledge.inc

1

ユニバーサルナレッジは、EC サイト向けに購買行動に連動した ASP 型サイト内商品検索エンジン、キーワードサジェストエンジン(クエリーサジェストエンジン)を提供しています。