6つのアノテーションタイプ:その違いとは?

6 つのアノテーションタイプ:その違いとは?

 

アノテーションとは?

データアノテーションは画像、映像などの学習用データにラベリングをする作業です。ご存じの方も多いと思いますが、機械学習アルゴリズムにはアノテーションされたデータが必要不可欠です。アルゴリズムが処理するためには、(品質の)アノテーションされたデータが必要だからです。

LQAのAIトレーニングプロジェクトでは、様々な種類のアノテーションを使用しています。どのような種類のアノテーションを使用するかは、主に、どのような種類のデータとアノテーションツールを使用しているかによって決まります。

 

6 つのアノテーションタイプ

バウンディングボックス:その名の通り、この方法はアノテーション対象物を長方形で囲む、というものです。この方法は主に、自動車、セキュリティ、eコマースに関連したデータに使用されています。

 

 

ポリゴン:  人間の体、文字、看板など、特殊な形を正確に認識する際にこの方法を使用します。対象物を明確な線で囲み、対象物の形、大きさを正確に抽出することによって、より質の高い機械学習を可能にします。

 

 

ポリライン:ポリラインは、バウンディングボックスの弱みを克服した方法と言えます。バウンディングボックスでは余分な面積も囲んでしまいますが、ポリラインではその面積をなくすことができます。この方法は、主にレーンや道路の画像に使用されます。

 

3Dキューブ:この方法で、対象物の容積をはかることができます。主に、車、建築物や家具に使用されます。

 

セグメンテーション:セグメンテーションはポリゴンと似ていますが、ポリゴンよりも複雑な方法です。ポリゴンは独立した対象物を1つ1つ選びますが、セグメンテーションは全てのピクセルに当てはまるラベルを付けていきます。そのため、この方法はより高度な認知を行うことができます。

 

ランドマーク:この方法は、人間のポーズや、顔に現れる表情やその感情の推定、検出に役立っています。ランドマークアノテーションに使用されるアノテーションツールは、特定の範囲内でのマークの密度を測ることも出来ます。

 

関連記事:

 

プロジェクトに必要なデータ収集やアノテーションでお困りの際は、お気軽にご連絡ください