6 つのアノテーションタイプ:その違いとは?

データアノテーションは画像、映像などの学習用データにラベリングをする作業です。ご存じの方も多いと思いますが、機械学習アルゴリズムにはアノテーションされたデータが必要不可欠です。

私たちはAI学習のプロジェクトでいくつかのタイプのアノテーションを行っています。アノテーションするデータの種類や使うべきアノテーションツールによって、使用するアノテーションの種類は異なります。

バウンディングボックス:その名の通り、この方法はアノテーション対象物を長方形で囲む、というものです。この方法は主に、自動車、セキュリティ、eコマースに関連したデータに使用されています。

 

ポリゴン:  人間の体、文字、看板など、特殊な形を正確に認識する際にこの方法を使用します。対象物を明確な線で囲み、対象物の形、大きさを正確に抽出することによって、より質の高い機械学習を可能にします。

 

ポリライン:ポリラインは、バウンディングボックスの弱みを克服した方法と言えます。バウンディングボックスでは余分な面積も囲んでしまいますが、ポリラインではその面積をなくすことができます。この方法は、主にレーンや道路の画像に使用されます。

 

3Dキューブ:この方法で、対象物の容積をはかることができます。主に、車、建築物や家具に使用されます。

 

セグメンテーション:セグメンテーションはポリゴンと似ていますが、ポリゴンよりも複雑な方法です。ポリゴンは独立した対象物を1つ1つ選びますが、セグメンテーションは全てのピクセルに当てはまるラベルを付けていきます。そのため、この方法はより高度な認知を行うことができます。

 

ランドマーク:この方法は、人間のポーズや、顔に現れる表情やその感情の推定、検出に役立っています。ランドマークアノテーションに使用されるアノテーションツールは、特定の範囲内でのマークの密度を測ることも出来ます。

 

プロジェクトに必要なデータ収集やアノテーションでお困りの際は、ぜひLQAにご相談ください!