なぜ ベトナムオフショア開発 を実施すべきでしょうか?

なぜ ベトナムオフショア開発 を実施すべきでしょうか?

近年、東南アジアはテクノロジーの中心地として注目されています。この地域は、多くのユニコーン企業の本拠地であるだけでなく、だんだん人気のあるオフショア開発発注先になっております。価格競争力に加えて、優秀な人材、経済的なポテンシャルの高さにより、ベトナムも最高水準のITアウトソーシング・サービスを求める企業にとって誘惑の国です。ベトナムと言えば、経済が発展していない国または戦争で荒廃した国などのイメージが非常に連想されます。しかし、情報技術業界における近年の功績と未来の情報技術の成長に向けた新しい方向性により、 ベトナムオフショア開発 企業は、国際的な顧客の信頼を得ることに成功しています。   1. 大きな可能性を秘めたベトナムのソフトウェア・アウトソーシング ベトナムは東南アジアの中心に位置しております。ベトナムの標準時はGMT+7であり、アメリカより12時間、イギリスより7時間で速くて、オーストラリアより3時間、日本と韓国より2時間で遅いです。ベトナムの経済成長率は、2021年に約4.8%になると予測されます。具体的に、ベトナム計画投資省外国投資局(FIA)は1~9月の海外直接投資(FDI)認可額が前年同期比4.4%増の221億4,600万米ドル(約2兆4,500億円)だったと発表した。 過去2年間の新型コロナウイルス感染症感染拡大にもかからわず、ベトナムは着実に発展し、そして、活況を呈している業界の一つはベトナムのソフトウェア・アウトソーシングです。 1.1. ベトナムはICT産業、特にソフトウェアの輸出で盛り上がっている 約15年前にITアウトソーシングサービスが台頭して以来、ベトナムのソフトウェア・アウトソーシングは、隠された宝石のようなものであり、ビジネスにテクノロジーを応用したい企業を誘惑してきました。実際、2014年から現在まで、ソフトウェア開発およびサービスのアウトソーシングにおいて、ベトナムは日本の第2位のパートナーとしてその能力を証明しています。     また、2021年に発表された「Global Services Location Index」によると、ベトナムは、経済的魅力、人材のスキル・供給力、ビジネス環境、デジタル共鳴の4つのカテゴリーで6位にランキングされて、新たなデジタルハブとして浮上しました。また、Tholon社の「Top 50 Digital Nations」では、ベトナムは9位にランクインしています。20年前に技術の進歩がほとんど見られない時代遅れの国だったベトナムは、急速なデジタルトランスフォーメーション(DX)に拍車をかけました。ICT企業は国内市場にサービスを提供するだけでなく、ソフトウェアやその他のソリューションを大量に輸出するまでになりました。このことは、次のような数字で証明されています。 ICTの輸出総額は915億ドルで、そのうちソフトウェアの輸出額は35億ドルと報告されています。この数字は、2021年には少なくとも5%成長すると予測されています。また、ソフトウェア&ITサービスは110億ドルを占めています(Vietnam Software and IT Services Associationの報告書による)。 2016年以降、ベトナムは「東南アジアのシリコンバレー」と称され、今後のデジタル経済の活況が予測されています。この急激な発展は、政府が法的枠組みやイニシアチブの形成に乗り出し、IT部門の成長に焦点を当てているため、さらにレベルアップするでしょう。 パンデミックという困難な時期を乗り越え、世界で最も要求の厳しい顧客との仕事を経験したことで、ベトナムは世界のソフトウェア・アウトソーシング市場でますます好まれるようになっています。 1.2.ベトナムのIT市場成長指数 情報通信省の2019年総括および2020年方向性報告書によると、2019年のICT産業総収入は112,350Bドルと推定され、そのうち81.5%がICT輸出分となっています。2020年は、ベトナムがデジタルテクノロジービジネスの開発に力を入れる「Make in Vietnam」戦略を公式に発表した最初の年でした。その後、デジタルテクノロジービジネスの数は28%増加し、約6万社に達しています。 ベトナムのデジタルテクノロジービジネスは、E-commerce、Fintech、Ride/food order、Edtech、Healthcare、AI、Machine Learning、Blockchainなどの12の主要分野に集中します。この集中が世界のトレンドと一致することで、ベトナムの能力は世界の需要、特にITアウトソーシングサービスを求める企業の需要に応えることができます。   2. 豊富なIT人材 ベトナムは世界の他の国々と同様に人材不足の問題に直面していますが、現在のIT労働者の数を見ると、業界全体の発展に向けて顕著な見通しが立っています。数字を見れば一目瞭然です。 現在、ベトナムには約40万人のITエンジニアがおり、さまざまな分野で活躍しています。養成機関を卒業する学生は、年間約5万人です。IT技術者の約53%が1〜3年の経験を持っています。面白いことに、数年の経験しかないにもかかわらず、多くのベトナム人技術者がシニア/リードレベルの専門知識を持っています。これらの数字から、ベトナムはITエンジニアの需要を満たすのに十分な人材プールを持っていることが証明されました。     ベトナムのITエンジニアは、世界のトレンドに合わせて、以下のような最も人気のある技術に焦点を当てています。フレームワーク/ライブラリについて フレームワーク/ライブラリ:Laravel(49.6%)、NodeJS(36.4%)、React(27.9%)。データベースの場合 MySQL (59.1%), SQL Server (40.0%), PostgreSQL (32.9%)、IDE&テキストエディターの場合 Visual Studio Code」(35.2%)、「Sublime Text」(34.9%)、「IntelliJ」(33.5%)。…

AI搭載のバーチャルアシスタント

インテリジェントバーチャルアシスタント(IVA):音声アノテーション による巨大な市場規模

インテリジェントバーチャルアシスタント(IVA)市場規模は、2020年には約40億米ドルの規模に達しました。そして、この市場は、2022年に177.2億米ドルの市場価値から、2030年までに1,760.5億米ドルに達すると推定され、予測期間中に38.82%のCAGRで成長すると予想されています。 AIによるバーチャルアシスタントの可能性と有用性は、技術的な側面と行動的な側面の両方からもたらされます。アプリ上でのアシスタントに対する需要の高まりと相関して、データトレーニングのためにAIシステムに継続的に入力されるデータがあります。 逆に言えば、AIを搭載したバーチャルアシスタントを実現するために最も重要な機能の一つが、データ入力、つまり音声アノテーションです。 1. インテリジェントバーチャルアシスタント(IVA)の急成長する業界 まず、IVA(Intelligent Virtual Assistant)とは、AIを搭載した仮想アシスタントというもので、人間と同じような応答ができるように開発されたソフトウェアのことです。 このアシスタントにより、質問をしたり、手配をしたり、さらには実際の人間のサポートを要求することができます。 1.1. なぜが台頭してきたのか? IVAは、主に顧客対応のコスト削減のために広く利用されています。また、ライブチャットやその他の形式のカスタマーエンゲージメントに迅速に対応することで、IVAは顧客サービスの満足度を高め、時間を節約するのに役立ちます。 IVAは、上記のような外部パフォーマンスに加えて、顧客情報を収集し、会話や顧客満足度調査の回答を分析することで、組織が顧客と企業のコミュニケーションを改善するのに役立てています。     インテリジェントなバーチャルアシスタントは、企業のアバターのような役割を果たします。顧客からの問い合わせを動的に読み取り、理解し、対応することができ、最終的には様々な部門のマンパワーのコストを削減することができます。 このようなIVAは、インフラのセットアップコストを省くことができるため、大企業に多く導入されています。これが、近年のIVAの収益が非常に高い理由であり、今後もそうなる可能性があります。 1.2.IVAは何ができるのか? AIを活用した仮想支援の使い安さや導入状況はいたるところで見られます。オペレーティングシステムやモバイルアプリケーション、あるいはチャットボットでも目にすることができます。機械学習やディープニューラルネットワークなど、AI技術の進歩を展開することで、仮想アシスタントはいくつかの特定のタスクを簡単にこなすことができます。 バーチャルアシスタントは、オペレーティングシステムでは非常に一般的です。これらのアシスタントは、カレンダーの設定、手配、アラームの設定、質問、さらにはテキストの作成などをサポートします。このようなマルチタスクのアシスタントは大規模なものであり、このようなアプリケーションはオペレーティングシステムの中だけに限られると思われるかもしれません。 しかし、モバイルユーザーやモバイルアプリの数が急増していることから、多くの起業家やスタートアップ企業が、自社製品のアプリ内にバーチャルアシスタントを導入し始めています。これにより、さまざまな分野で必要とされるデータ入力の需要が高まっています。 例えば、ヘルスケアサービスのアプリでは、医学用語などヘルスケアに関連する特定の 音声アノテーション が必要です。 ResearchAndMarkets.comの「インテリジェントバーチャルアシスタント(IVA)の世界市場2019-2025年」に関するレポートによると、「Industry Size, Share & Trends」と題して、次のように指摘しています。スマートスピーカーは最も速いペースで発展しており、IVAの主要ドメインとして浮上している。IVAでは、Text to Speechが最大のセグメントです。2025年には153億7,000万ドル以上の売上に達すると予測されています。 IVAの市場で優位に立っている国はヘルスケアを主要産業とする北米です。主要なプレイヤーは、Apple Inc.、Oracle Corporation、CSS Corporation、WellTok Inc.、CodeBaby Corporation、eGain Corporation、MedRespond、Microsoft、Next IT Corporation、Nuance Communications, Inc.、True Image Interactive Inc.などです。 このレポートを通して、AI搭載のバーチャルアシスタント市場の発展と成長の可能性が急成長していることがわかります。異なるドメインごとに、IVA導入のための異なるアプローチがあります。 より良いサービスやビジネスの発展のために、企業は効果的なカスタマーエンゲージメントを求めており、そのため、様々な製品に実装される仮想アシスタントの数は増加しています。 現在、インテリジェントバーチャルアシスタント市場は、導入率の高さとIT投資の増加を背景に、主にBFSI産業の垂直軸によって牽引されています。しかし、自動車およびヘルスケア分野は最も収益性の高い垂直セグメントであり、予測期間中もこの傾向を維持すると思われます。 2.  音声アノテーション はIVAにどのように役立つのか? 通話、ショッピング、音楽配信、コンサルティングなど、生活のあらゆる場面でバーチャルアシスタントが登場するようになり、音声データ処理の必要性が高まっています。また、Speech to TextやText to Speechによるアノテーションだけでなく、より高度な形式であるPart of…

パッシブ・リクルートメントで技術系人材の探し方・採用方法

パッシブ・リクルートメントで技術系人材の探し方・採用方法

IT業界では、優秀な人材がどんどん少なくなってきており、人事担当者は、潜在的な候補者を増やすための方法を模索しています。 Stack Overflowの開発者を対象とした最近の年次調査によると、積極的に仕事を探している回答者はわずかに15%であり、新しい仕事の情報を聞くことに興味を持っている開発者は約75%であるということです。これらの数字を見たら、人事担当者は従来のように「すでに仕事を探している候補者」を採用するだけにとどまらず、一般的なIT人材の75%を占める「受動的な候補者」のポテンシャルを把握すべきだということがわかります。 人事担当者は、パッシブ・リクルートメントの技術を認識することで、人材プールを効果的に活用し、拡大することができ、その結果、最も困難なITポジションを埋めることができます。   1. 受動的な候補者とは? 受動的な候補者とは、新しい仕事の機会を積極的に探していない人のことです。受動的な候補者は、すでに雇用されており、多くの企業が求めているスキルや経験を持っています。   2. なぜ人事スペシャリストはパッシブ・リクルートメントを行うべきなのか? Stack Overflowの調査によると、IT人材の求職状況について、回答者は以下のように3つのグループに分類されました。 現在、仕事を探している積極的な候補者(15.2%) 雇用されているが、新たな機会を求めている受動的な候補者(58.7%) 雇用されており、新しい機会を考慮しない超受動的な候補者(15.2%) これらのグループの中で、受動的な求職者は最大のグループとして際立っており、需要の高い技術系の仕事に就く人事担当者にとっては、潜在的な採用ソースとなっています。 受動的な候補者は、現在雇用されており、他の雇用主でその役割をうまく果たしている可能性が高いので、人事担当者は、候補者の現在のプロジェクトを少し調べたり、相互参照チェックを行ったりすることで、候補者の潜在能力を確認し、評価する機会を得ることができます。 さらに、高度なスキルを持った候補者の市場での競争は非常に激しいものがあります。実際に、非常に優秀な積極的な候補者は、10日以内に市場から消えてしまうことが多いのです(officevibe.comが収集した統計による)。このような理由から、採用の可能性を高めるためには、採用担当者が受動敵な候補者を重視することが非常に重要です。 このグループに注目するもう一つの理由は、受動的な候補者が貴社のビジネスに影響を与える可能性が高いことです。彼らは、新しい職場で自分を変えようとする意欲が120%高いのです。さらに、これらのグループは主にシニアの技術系人材であるため、積極的な候補者と比較して、スキルアップの機会を必要とする可能性が17%低くなります。トレーニングの必要性が低いということは、必要な時間とリソースが少なくて済むということであり、これによって雇用主は多大な利益を得ることができるため、受動的な候補者は最も重要な採用ソースの一つとなっています。   3. 積極的な候補者と受動な候補者の違いとは? 一般的に、積極的な候補者は求職活動に対するモチベーションが高く、すべての準備が整っているので、すぐに採用プロセスを開始することができる。一方で、受動的な候補者は面接などのにすぐに参加するのが困難であるようです。そのため、採用担当者はより柔軟に、この人材を活用する必要があります。   受動的な候補者 積極的な候補者 1. ポテンシャル     候補者                         ……………… ……………….. ほとんどがシニアレベルの技術系人材で、積極的に仕事を探しているわけではないが、新しい仕事のチャンスに前向きな人たちです。       仕事を持っているかどうかは別にして、転職サイトやソーシャルメディアで活動している人です。彼らは、履歴書や応募書類を送り、あなたと一緒に採用活動を行う準備をしています。               …

完全自動運転車はデータアノテーションで実現できるのか?

完全自動運転車はデータアノテーションで実現できるのか?

AIとデータアノテーションの最も一般的なユースケースの1つは自律走行車です。自律走行車(または自動運転車)のアイデアは、エンターテインメントや実際の交通機関においても、常に魅力的な利用分野となっています。 かつては架空の話でしたが、情報技術の進化と長年培ってきた技術力により、自律走行が可能になりました。

 

 

自律走行車におけるAIとデータアノテーションの最も有名な実装例は、おそらくTesla Autopilotでしょう。これは、車が車線内でハンドル操作、加速、ブレーキを自動的に行い、運転の最も負担のかかる部分を支援するものです。 しかし、テスラオートパイロットは、欧米のいくつかの国でしか成功が確認されていません。ここでの本当の疑問は “テスラオートパイロットは、東南アジア諸国の混雑した道路で使用できるのか?

 

1. AI搭載の自律走行車におけるデータアノテーションの役割

人工知能(AI)がインダストリー4.0の代表的なトレンドであることは否定できません。大きな言葉や、日常生活におけるAIの「先見の明」的な見通しは実に魅力的ですが、実際にそれを実現することは見過ごされがちです。

実は、AIの実装の始まりは、何年も前に、架空の大ヒット映画でよく見かけるバーチャルアシスタントの基礎から始まっています。映画の中では、世界は機械と自動化によって支配されています。特に、車や船、飛行機などの乗り物は、AIによる制御システムによってうまく管理されています。AI開発の多面的な革新により、自律・自動運転車の成功をはじめ、上記の多くが現実のものとなりました。

1.1. 高精度のトレーニングデータ

自動運転車の重要な特徴は、ハードウェアとソフトウェアの2つです。自律走行車が正しく機能するためには、周囲の環境を感知し、人間の手を借りずに物体をナビゲートすることが求められます。ハードウェアは、道路上で車を走らせるためのものです。そのほか、自律走行車のハードウェアには、カメラや熱センサーなど、物や人の存在を検知できるものが搭載されています。その立脚点となるのが、機械学習のアルゴリズムを学習させたソフトウェアではないでしょうか。

ラベル付けされたデータセットは、前述の学習アルゴリズムの入力データとして重要な役割を果たします。これらのデータセットに注釈が付けられれば、AIソフトウェアの「学習能力」が豊かになり、したがって自動車の適応性も向上する。ラベル付けされたデータセットの精度が高ければ、アルゴリズムの性能は向上します。データアノテーションの精度が低いと、運転中にエラーが発生する可能性があり、非常に危険です。

1.2. エンドユーザーの利便性向上

一流の体験のためにお金を払わない人はいないでしょう。テスラを例にとってみましょう。テスラのモデルは、人々が無意識のうちに他の自律走行車ブランドに設定する基準、ベンチマークとなっています。デザインからオートパイロットによる自動運転の操作性まで、高級感だけでなく安全性も兼ね備えています。テスラがどのように車を設計するかは別の話です。お客様のために本当に大切なのは安全性です。すべてを “機械 “に任せるのは、最初は怖いかもしれませんが、テスラも多くの実験やAIソフトウェアのバージョンを通じてそれを保証しています。実際、テスラのオートパイロットは、欧米複数国の高速道路を容易に走行できることが証明されています。

 

 

テスラの自動運転モデルXが非常に混雑なベトナムの道路で敗北した映像を見たことがあるかもしれません。しかし、私たちは、自律走行車が最も必要とされるシナリオを振り返ってみる必要があります。 ここでの答えは、フリーウェイとハイウェイです。そして、テスラはこれらの道路でとてもうまくやれるのです。この場合のデータアノテーションの役割は、高品質のアノテーションされたデータセットを通じて、機械が高い頻度で訓練されることで、乗客の安全を確保することです。

 

2. 自律走行車の未来

自動運転がない状態から完全自動運転へと簡単に移行できるわけではありません。実際には、レベル3の「条件付き運転自動化」がやっとなのです。

  • レベル0(自動化運転なし): 車両は手動で制御されています。一部の機能は、問題が発生すると自動的に「ポップアップ」するように設計されています。
  • レベル1(運転支援)。ステアリングやアクセルの操作(クルーズコントロール)などの運転支援システムが単独で搭載されています。
  • レベル2:(部分的な自動運転):ADAS(ステアリングとアクセルの操作)に対応している車両です。ここでは、人間が運転席に座り、いつでも車をコントロールできるため、自動化は自動運転には及びません。
  • レベル3(条件付き自動運転):環境検知機能を持ち、加速して遅い車を追い越すなど、自分で判断することができます。しかし、人間によるオーバーライドが必要です。システムがタスクを実行できない場合、ドライバーは常に注意を怠らず、制御できるようにしておく必要があります。テスラのオートパイロットは、レベル3に認定されています。
  • レベル4(高度な自動運転):車両は、限られたエリア内で自動運転モードで動作できます。
  • レベル5(完全自動運転):人間の注意を必要としない車両です。ハンドルやアクセル・ブレーキのペダルもありません。。まだまだレベル5には程遠い状況です。

テスラのオートパイロットがレベル3に認定されたことで、私たちは完全な運転の自動化への道のりの半分しか進んでいません。しかし、私たちは個人的に、これらのレベル3車両の問題はAIシステムのトレーニングデータであると考えています。これまでに投入されたデータセットは非常に限られており、大海の一滴にしかすぎません。

AIシステムを学習させるには、データセットが膨大な量であることはもちろん、精度だけでなく高品質であることが求められるため、簡単なことではありません。

テスラをはじめとする自律走行車メーカーは、競争に打ち勝つために、かなりのスピードを求めています。このような企業は、自分たちでデータ処理を行うのではなく、データ処理の管理と実行を効率的に行うために、アウトソーシングベンダーの助けを求めることがよくあります。これらのベンダーは、データ収集とデータアノテーションの両方をサポートします。

データアノテーションを気にすることなく、自律的な市場に参加したいですか?LQAのコンサルティングを受けて、あなたのビジネスに最適なデータアノテーションツールを見つけてください。 専門家によるフルサポートをご希望の方は、今すぐお問い合わせください。

データラベリングの品質を確保するための基本的なガイド

データラベリングの品質を確保するための基本的なガイド

データのラベル付け品質の問題は、AI/MLコミュニティで大きな関心事となっています。このパズルを解くときに出くわす最も一般的な「原則」は、おそらく「Garbage in, garbage out」でしょう。

このように言うことで、私たちが強調したいのは、人工知能や機械学習の開発プロジェクトにおけるトレーニングデータとの基本的な法則です。AI/MLモデルに供給される質の悪い学習データセットは、操作に多くの誤りをもたらします。例えば、自律走行車のトレーニングデータは、その車が道路上で機能するかどうかの決め手になります。質の悪いトレーニングデータを使用すると、AIモデルが人間を物体と間違えたり、逆に物体を人間と間違えたりする可能性があります。いずれにしても、質の悪いトレーニングデータは事故のリスクを高めることになり、自律走行車メーカーにとっては最も避けたい事態となります。
高品質な学習データを得るためには、データ処理の過程でデータラベリングの品質保証を行う必要があります。

弊社は高品質なトレーニングデータセットを確保するために、以下の3つのアクションを行っています。AI/MLモデルに最適なトレーニングデータを提供するための基本的なガイドをご覧ください。

 

1. データラベリングの品質管理を強化するためのお客様の要求を明確化

品質の高いデータラベリングとは、単に最も丁寧にアノテーションされたデータや、最高品質のトレーニングデータを意味するものではありません。戦略的なデータアノテーションプロジェクトでは、トレーニングデータの要件を明確にする必要があります。アノテーションチームのリーダーが答えなければならないのは、どの程度の品質のデータが必要なのかということです。

データアノテーション品質を提供するベンダーとして、私たちが常にお客様にお聞きするのは、その要件です。「データセットを扱うのにどれだけ手間がかかるか」、「アノテーションの精度はどうしたいか」などです。これらの質問に答えることで、後々のプロジェクト全体のベンチマークとなるのです。

 

 

人工知能と機械学習の実装は非常に幅広いことを覚えておいてください。自律走行車や交通機関での一般的なアプリケーションのほか、AIやMLはヘルスケアや医療、農業、ファッションなどでもデビューしています。それぞれの業界には、何百もの異なるプロジェクトがあり、異なる種類の対象物を扱い、それゆえに異なる品質要件があります。

簡単な例として、道路のアノテーションと医療データのアノテーションを紹介します。道路のアノテーションの場合、作業は非常に簡単で、一般的な知識を持ったアノテーターがいれば大丈夫です。一方、このアノテーションプロジェクトでは、アノテーションが必要なデータセットの数が数百万の動画や写真にも及ぶため、アノテーターは許容範囲内の品質で高い生産性を維持する必要があります。

一方、医療データでは、特定の知識を持った医療分野で働くアノテーターが必要です。糖尿病性網膜症の場合、訓練を受けた医師が写真から糖尿病性網膜症の重症度を評価することで、この分野にディープラーニングを適用することができます。

 

 

よく訓練された医師であっても、すべてのアノテーションがお互いに一致するとは限りません。一貫した結果を得るためには、1つのアノテーションチームが各ファイルに何度もアノテーションを行い、最終的に相関関係を得る必要があるかもしれません。それは、与えられたデータがどれだけ複雑か、またお客様がどれだけ詳細なデータ出力を望んでいるかという問題です。これらが明確になれば、チームリーダーは必要な成果を得るためのリソースの配分を考えることができます。指標と品質保証プロセスはこの後に定義されます。

また、クライアントは、アノテーションされるすべてのデータセットの「ベンチマーク」となるサンプルセットを提供する必要がある。これは、データアノテーションの品質を保証するための、最もわかりやすい手法です。完璧にアノテーションされたデータの例があれば、今度はアノテーターがトレーニングを受け、仕事のベースラインを提示することができます。

ベンチマークを理想的な結果とすることで、各アノテーターの精度やパフォーマンスを評価するための一致率の指標を算出することができます。アノテーションとレビューの両方のプロセスに不確実性がある場合、QAスタッフはこれらのサンプルデータセットを使って、どれが適格でどれがそうでないかを定義することができます。

 

2. 多層的なQAプロセス

データラベリングプロジェクトにおけるQAプロセスは、企業によって異なります。ロータスQAでは、国際的に標準化された品質保証プロセスを遵守しています。事前に設定された優先は、常にプロジェクトの開始時に明確にされます。これらの設定は1つの「ベンチマーク」にまとめられ、後にすべてのラベルとアノテーションの「ゴールデンスタンダード」として機能します。

2.1. 自己診断

このステップでは、アノテーターに自分の作業のレビューをしてもらいます。自己評価をすることで、アノテーターはプロジェクト開始時のデータアノテーションツール、アノテーション、ラベリングを振り返ることができるようになります。通常、アノテーターは、時間的にも仕事的にも大きなプレッシャーの中で仕事をしなければならず、そのために仕事に狂いが生じてしまう可能性があります。セルフチェックから始まる品質保証では、アノテーターがゆっくりと自分の仕事ぶりを見直すことができます。間違いや逸脱の可能性を認めることで、アノテーターは自分でそれを修正し、将来的にそれらを避けることができます。

2.2. クロスチェック

データサイエンス、特にデータアノテーションにおいて、「バイアス」という言葉を聞いたことがあるかもしれません。アノテーションの偏りとは、アノテーターがデータをラベル付けする際に独自の習慣を持っているため、提供されたデータに対して偏った意見を持ってしまうことを指します。場合によっては、アノテーターの偏りがモデルの性能に影響を与えることもあります。よりロバストなAIやMLモデルを構築するためには、偏ったアノテーションを排除するための有効な手段を講じる必要がありますが、そのためのシンプルな方法の一つがクロスチェックです。

 

 

アノテーションの過程でクロスチェックを行うことで、作品全体の見方が変わり、アノテーターは同僚の作品の間違いやエラーを特定することができます。また、このような異なる視点を持つことで、レビュアーは偏った注釈を指摘することができ、チームリーダーはさらなる行動を起こすことができます。チームリーダーは、手直しをしたり、注釈が本当に偏っているかどうかを確認するために再度評価を行ったりすることができます。

2.3. マネージャーの評価

アノテーションプロジェクトマネージャーは、通常、アノテーションプロジェクトの日常的な監督を担当します。主な仕事は、作業員の選定と管理、データの品質と一貫性の確保などであります。マネージャーは、クライアントからデータのサンプリングを受けて、必要なメトリクスの作業を行い、アノテーターの教育訓練を実施する役割を果たします。クロスチェックが済んだら、マネージャーはアウトプットをランダムにチェックして、クライアントの要求を遵守しているかどうかを確認します。これらのチェックに先立ち、アノテーションのプロジェクトマネージャーは、品質保証のための「ベンチマークライン」を引かなければなりません。一貫性と正確性を確保するために、事前に設定した品質に満たない作業は、手直ししなければなりません。

 

3. 品質保証スタッフの関与

データラベリングの品質管理は、アノテーションチームだけに頼ることはできません。実際には、専門的で経験豊富な品質保証スタッフの関与が必須となる。アノテーション作業の最高の品質を確保するためには、品質保証スタッフのチームが必須である。品質保証スタッフは、アノテーションプロジェクトマネージャーの管理下ではなく、アノテーションチームの外にある独立した部門として働きます。
データアノテーションスタッフ全体に占める品質スタッフの理想的な割合は10%を超えません。QAスタッフは、プロジェクト内のすべてのアノテーションされたデータをレビューすることはできませんし、するつもりもありません。実際には、ランダムにデータセットを取り出して、もう一度、アノテーションをレビューします。

 

 

これらのQAスタッフは、データサンプルについて十分な訓練を受けており、アノテーションされたデータの品質を評価するための基準を持っています。これらの評価基準は、事前にQAチームのリーダーとアノテーションプロジェクトマネージャーの間で合意されなければなりません。セルフチェック、クロスチェック、マネージャーの評価の3段階のレビューに加えて、QAスタッフがアノテーションプロジェクトに参加することで、データ出力が事前に定義されたベンチマークに確実に適合し、最終的には最高レベルのトレーニングデータを確保することができます。

データラベリングの品質を向上するため、専門家の話をもっとお聞きしたいですか?ロータスQAにお気軽にお気軽にお問い合わせください

 

自動データラベリングが未来の技術のはなぜ?

自動データラベリングが未来の技術になるのはなぜ?

自動データラベリングは、現在絶えず言及されている新機能であり、時間とリソースを要するカジュアルなマニュアルアノテーションの解決策とみなされています。データセットにアノテーションを施すのに何時間もかかるマニュアルデータラベリング(通称:マニュアルデータアノテーション)に対し、オートラベリング技術は、データを高度に処理するために、よりシンプルで速い方法のようです。

 

1. 通常のデータセットの扱い方

データラベリングの最も一般的でシンプルなアプローチは、もちろん完全な手動によるものです。人間のユーザーは、一連の生ラベル付けされていないデータ(画像やビデオなど)を提示され、一連のルールに基づいてラベル付けを行うことになります。例えば、画像データを処理する場合、分類タグ、バウンディングボックス、ポリゴン分割、キーポイントなどが代表的なアノテーションの種類です。

 

 

最も簡単で安価なアノテーションである分類タグは、わずか数秒で済むかもしれませんが、細かいポリゴンのセグメンテーションは、オブジェクトの各インスタンスごとに数分かかる可能性があります。
AIオートメーションがデータラベリング時間に与える影響を計算するため、ユーザーがオブジェクトの周囲にバウンディングボックスを描き、与えられたリストからオブジェクトクラスを選択するのに10秒かかると仮定してみましょう。これは私たちの経験的な証拠に裏付けられた観察可能な仮定です。

今回のケースでは、10万枚の画像と1枚あたり5個のオブジェクトからなる典型的なデータセットの場合、ラベリングには約1,500工数がかかり、これはデータラベリングだけで約1万ドルを費やすことに相当します。

また、ラベリングされたデータを手作業で確認するための品質管理のレイヤーを追加することが納品までの時間も長くなります。訓練されたユーザーでさえ、各バウンディングボックスの注釈をチェックするのに約1秒かかるため、ラベリングのコストが約10%増加します。

ワークフローの中には、コンセンサスベースの品質管理を採用する場合があります。これは、複数のユーザーが同じデータに注釈をつけ、その結果を統合/比較して品質管理を行うものです。コンセンサスベースのワークフローでは、コンセンサスを得るために重複した作業を行うユーザーの数に比例して、かかる時間と費用が大きくなります。簡単に言えば、3人のユーザーが同じ画像に3回ラベル付けをした場合、3回分のアノテーションの費用が必要になるということです。

ここで強調しておきたいのは、データラベリングにおいて最もコストのかかるのは下記の2つのステップです。

  • データラベリング自体
  • 品質管理のためのレビューと検証作業

したがって、オートラベル技術の最大の目的は、データラベリングと検証の両方にかかる時間を短縮することです。

ありがたいことに、AIと機械学習の進歩により、Auto-Label技術は大きく進歩しました。しかし、すべてのAuto-Labelテクノロジーが同じように作られているわけではなく、多くの場合、AIを使用する素朴な試みは、AIによって引き起こされたエラーを修正するために、より多くの人間の入力を必要とすることになります。そのため、選択したAIがデータのワークストリーム全体にどのような影響を与えるかを極めて慎重に判断しなければなりません。

ここでは、Superb AIのAuto-Labelとは一体何なのか、この技術の背景にある目的、そしてSuperb AIがこの分野でどのような進歩を遂げているのかをご紹介します。

 

2. オートラベリングのメリット

オートラベリングという言葉は、この分野では非常に新しい言葉ですが、それを実装し実現するための技術的進歩は高速で進んでおり、現在では多くのツールが市場に出回っています。では、データラベリングとはどのようなもので、どのようなメリットがあるのでしょうか。

2.1. オートラベリングとは?

 

 

オートラベリングとは、人工知能(AI)を応用してデータセットのエンリッチ、アノテーション、ラベリングを行うデータアノテーションツールに搭載されている機能です。この機能を備えたツールは、機械学習のためのデータラベリングにかかる時間とコストを削減するために、人間の作業を増強します。

ほとんどのツールでは、事前にアノテーションされたデータをツールに読み込むことができます。プラットフォームに進化しているより高度なツール(例えば、ツールとソフトウェア開発キット(SDK)を組み合わせたもの)では、AIを活用したり、独自のアルゴリズムをツールに持ち込んだりして、データをオートラベリングすることで、データエンリッチメントのプロセスを改善することができます。

また、作業者がアノテーションを検証できるように、アノテーションを提案する予測モデルを提供するツールもあります。また、内蔵されたニューラルネットワークを活用して、アノテーションを行うたびに学習する機能もあります。これらの機能はいずれも、機械学習チームの時間とリソースを節約し、データアノテーションのワークフローに大きな影響を与えるでしょう。

2.2. オートラベリングの優れたメリット

機械学習のために画像をアノテーションするツールを使用している組織との仕事の中で、オートラベリングがデータアノテーションのワークフローに適用された場合、2つの方法で役に立つことがわかりました。

データセットの一部または全部に事前にアノテーションを施します。自動化された後、作業者はアノテーションを確認、修正、完成させます。自動化ですべてのアノテーションを行うことはできず、例外やエッジケースが発生します。完璧とは言えませんので、必要に応じて人がレビューや修正を行うことを計画しなければなりません。

人に送る仕事の量を減らす。自動ラベリングモデルは、ユースケースやタスクの難易度などに基づいて信頼度を割り当てることができます。また、データセットにアノテーションを付与し、信頼度の低いアノテーションをレビューや修正のために担当者に送ります。

自動化機能を備えたツールを使用するチームと、同じデータに手動でアノテーションを行うチームに分かれて、時間をかけた実験を行いました。自動ラベリングが低品質な結果をもたらし、アノテーション作業に要する時間が長くなるケースもありました。一方で、自動ラベリングが有用な出発点となり、作業時間が短縮されたこともあります。

 

 

ある画像のアノテーション実験では、自動ラベリングに人力によるレビューと改善を組み合わせることで、100%手作業によるラベリングプロセスよりも10%速くなりました。この時間短縮は、自動化が時間をかけて学習されるにつれて、40%から50%の速度に増加しました。

また、車両については5ピクセル以上の誤差があり、カメラから最も離れた物体を見逃していました。この画像では、自動ラベリング機能により、ゴミ箱に人のタグが付けられているのがわかります。アノテーション前の予測は既存のモデルに基づいており、オートラベリングのミスはそれらのモデルの精度を反映していることを覚えておく必要があります。
データアノテーションツールには、人工知能を使ってデータにラベルを付けるオートラベリングとも呼ばれる自動化機能を搭載することができ、作業員はそのラベルを確認したり修正したりすることで、作業時間を短縮することができます。

道路標識のスクリーンショットでは、自動ラベル付けにより、ゴミ箱を囲むバウンディングボックスで画像を豊かにすることができました。これは間違いでした。その物体を人としてラベル付けしてしまったのです。オートラベリングは完璧ではありませんが、データラベラーのチームにとっては、出発点として役立ち、作業時間を短縮することができます。

 

 

プレアノテーションに適したタスクもあります。例えば、私たちの実験の例で言えば、プレアノテーションを使って画像にラベル付け、データラベラーのチームがラベルやバウンディングボックスのサイズを変更するか削除するかを判断することができます。このラベリング時間の短縮は、ピクセルレベルのセグメンテーションで画像にアノテーションを施す必要があるチームにとって有益です。

オートラベリングを適用するには、創造性が必要だということです。オートラベリングをうまく活用しているお客様は、必要に応じて試行錯誤を繰り返すことを厭わないことがわかりました。オートラベリングは、AI技術、特に機械学習をより良く理解するための一つの突破であり、この新しい用語にはまだ多くの発見があります。

 

Website: https://jp.lotus-qa.com/
Tel: (+84) 24-6660-7474
Fanpage: https://www.facebook.com/LotusQualityAssurance

オフショア開発を実施する際にどんな課題に直面しますか?

オフショア開発を実施する際にどんな課題に直面しますか?

新型コロナウイルスのの世界的流行による経済活動の停止のため、多くの企業はDXの導入を検討し、実装しています。企業はDX推進のために実行可能での費用対効果ソリューションとしてオフショア開発サービスを選択しています。しかし、オフショア開発はあらゆるビジネスに適するソリューションではありません。このモデルはコスト削減に優れたメリットの一方で、取り組むべき多くの課題ももたらします。これらの慢性的な問題は、大規模なタレントプールと健全な財政を維持できる企業であっても、企業のDX導入に悪影響を与える可能性があります。これらの困難に収拾しように、下記の オフショア開発の課題 を一緒に深くを極めてしましょう!   1. エンジニアの質 オフショア開発を実施したい企業はより低コストで望みのような結果が得られることを非常に期待しています。 ただし、これは単に理想的な遠景です。実際に、多くのオフショア開発プロジェクトは求めるレベルを満たさないオフショアチームのエンジニアのため失敗してしまいました。 オフショア開発企業と協業する際に、技術的な面で双方間の非互換性はしばしば発生します。プロジェクトに適しないスキル・経験を有すエンジニアの参加は製品の品質に良くない影響を与えます。最悪の場合は納品されたものが正常に動かないことです。     問題解決:オフショア チームをうまく稼働させるように、企業はオフショアチームにコミュニケーションと技術面で要件について全体像を描くことが必要です。例えば、必要なプログラミング言語、フレームワーク、さらにはソフトスキルなどを明確にすべきです。要件が詳しければ、詳しいほどいいです。そして、面接を設定して、実績とエンジニアの質をしっかり見極める必要もあると思います。   2. 追加コスト オフショア開発は大幅にコストを削減することに役立つが、追加コストがかかる場合もあります。これらの追加コストは、追加のインフラストラクチャコスト、管理コストや手戻りコストであることが可能です。 そして、いかなる変更は費用対効果の減少につながる可能性があります。最終的に、これは採用パーティーの提案と財務計画に消極的な影響を及ぼすかもしれません。 問題解決:発注前の準備を綿密に行うのは追加コストを抑えることに役だちます。具体的には発注の目標を明確にしたり、適当なオフショア開発プロバイダーを選択したり、必要な費用を精密を計算したりすること等をすべきです。これにより、作業プロセスがより円滑に行われ、仕事の品質が確保されるので、手戻り等のコスト・時間を下がることできます。企画設定と費用推定などに骨を折る場合はオフショア開発分野におけるスペシャリストを依頼すべきです。 その上、開発過程での変更に対応できるオフショア開発企業を選択することも追加コストのリスクを減少すことに役だちます。   3. オフショア開発プロジェクトにおける時差 オフショア開発を実施すると、時差は双方間のコミュニケーション効果を大きな影響を及ばすかもしれません。お客さまとベンダー間の時差が大きすぎると、メール、特に電話にてコミュニケーションは一段難しくになります。製品に何かトラブルまたはバッグ等が発生する場合、時差によるレポート・処理の遅れは双方に甚大な被害をもたらす可能性があります。 したがって、日本企業が発注したい時、オフショア開発先としてアジア圏内を選択すれば、時差によるリスク・問題を減少することができます。これはベトナムをはじめとしてアジア諸国でのオフショア開発を実施することは企業に注目されています。   問題解決:日本とベトナムの時差はわずか2時間だが、時差による問題がまだ起こすことが可能です。異なるタイムゾーンといった問題に対処するために、自社とベンダーは相談して、固定スケジュールを設定する必要があります。このスケジュールには、、何が達成されたか何が達成されるべきかについて定期的なチェックポイントと会議が含まれるべきだと思います。   4. コミュニケーション不足 コミュニケーション不足は、オフショア開発プロジェクトで最大の問題の1つです。この問題の原因として、次の要因が考えられます。 4.1. 言語の壁 多くの国際的なクライアントと取り組まなければならないため、言語の壁はどのODCにとって一般的な課題です。日本語がどれほど上手であっても、外国人である開発チームが日本語でプロジェクトの要件を理解するのは困難だと考えられています。その上、仕様書が日本人のスタッフであっても理解しずらい場合もあるから、それを他の言語に翻訳するのは誤解につながる可能性があります。双方間の誤解が誤解が生じると、確認・修正のために追加時間とコストがかかることになります。 問題解決:専門的な知識と高い日本語スキルを有すブリッジSEとコミュニケーターを採用することが言語の壁を乗り越えることに役立つ方法の一つです。オフショアチームの技術エンジニアも、日本語での基本的なIT用語を把握することが必要です。その上、双方の技術エンジニアは複雑な単語・用語を最小限に使用することが期待されています。これにより、誤解が発生するリスクが大幅に抑えられます。     そんな問題を解決するために、言語能力について要件を明確にすることもお勧めされています。オフショア開発を実装している多くの企業は、最初の要件としてオフショアチームの日本語能力証明書を要求しています。面接も望んでいる日本語能力を有すオフショアチームを確認するために、実施されるかもしれません。 言語の壁による誤解をなくすために「最後の手段」は、日常の情報を交換することです。例えば、写真や図は通常の会話よりも直接的に話し、詳細な説明の時間と労力を節約します。 4.2. 文化の違い 文化の違いは、オフショア開発における誤解を与える主な要因ではないが、双方間のコミュニケーションにも消極的な悪影響を及ぼしています。文化の違いはコミュニケーションにおける誤解をもたらし、仕事効果とチームの士気を悪い影響を与える可能性があります。 問題解決:文化の違いは地理、歴史、政治や宗教などの要素に関係しているので、目指しているオフショア開発委託国の習慣、特徴的なワークスタイル・性格や生活水準などをまじめに研究すべきです。これは「カルチャーショック」を和らげるだけでなくコミュニケーションにおける誤解を減少することに役だちます。その上、快適な作業環境を作成できるように、ミーティングにおいて相手国の言語で簡単な言葉を話すこともいいアイデアだと言われています。しかし、異文化の環境における仕事をすると、一番大切のは自分と相手の違いを理解し、尊重することだと思います。   5. 不明確な目的と期待 締め切りに間に合わなかったり、燃え尽き症候群有病率と離職率が高くなったりすることは期待を達成しなかった兆です。特に、ワ​​ークロードが指数関数的に増加しているIT業界では、残業や労働時間の頻度が高くなっています。これは従業員が強いストレスをかんじることにつながります。 リーダーシップとコミュニケーションの不足による不明確な目標は漠然とした戦略につながることが可能です。     問題解決:目標を明確にする:具体的で測定可能な目標を設定します。測定可能な目標を設定すると、達成度を数値で計算できるので、チームマネージャーが運用作業を追跡しやすくします。いずれかのタスクで問題が発生した場合、担当者を即座に特定して、タイムリーな解決策ができます。 目標を明確にした後、それらの目標を達成するための期限を設定することも必要があります。自社とプロバイダーの双方が一緒に各リリースに最適な時間枠とスケジュールを定義する必要があります。 6. セキュリティのリスク オフショア開発を行う際、セほとんど企業は非常にキュリティの面で懸念を抱くようです。国内のサードパーティはおろか、外国の企業にITに関連する重要な作業を割り当てるのは深刻なリスクをもたらします。機密情報が流出するのは双方のイメージ・経済の面に対して深刻な損失をもたらす可能性があります。…

ソフトウェアテスターを評価するための 適切な面接質問

ソフトウェアテスターを評価するための 適切な面接質問

  ソフトウェアテストは、製品の質を保証するためににソフトウェア開発ライフサイクルにおける必須の作業であるので、テクノロジー企業はテストチームを構築することが必要です。 市場でソフトウェア開発者の数が増えていることと反対し、ソフトウェアテスターは豊富ではありません。テスターの需要が高くなっているが、企業は新卒業生である候補者を拒否する傾向にあります。その理由で、テスターの不足という状況は驚くべき問題になっています。     テスターに高給を支払う企業も増えてきましたが、、経験豊富なソフトウェアテスターを採用できることは本当に困難です。したがって、ジュニアテスターのスキルと知識を高めようと努めている企業もあります。 ソフトウェアテスターの人材が豊富だが、経験の不足という状況に対応するように、企業は候補者向けて必要なスキル等につてい徹底的なチェックリストを準備することが必要です。下記はソフトウェアテスターを採用する際に、企業が考慮すべき技術的側面です。 テストの種類とテストへのアプローチ方法に関する基本的な知識 テスト環境 異なる分野における候補者のテストに関する知識と経験 テストツール テストプロセス   面接担当者が面接プロセスについて明確にすべきなこと 探しているテストエンジニアの種類:テストに関して最も人気のある2つの仕事は、手動テストと自動化テストです。それぞれの仕事に対して、面接時に適当な基準を考慮すべきです。 ターゲット分野:あなたのビジネスが特定の業界・分野内でサービスまたは製品を提供している場合は、ターゲット分野を明確にするのは複雑ではないようです。しかし、人材を募集するITアウトソーシングベンダーに対して、次のプロジェクトの分野を定めることは、最適な候補者を見つけることに役だちます。 テスター向けて適切なキャリアパス:仕事を探す時に、テストエンジニアはその企業が自分のキャリアパスにどうように役立つかをすごく関心します。それで、将来の対立を避けるために、雇用者と候補者の両方は出されるキャリアパス制度の均一を確保してください。 才能のギャップは一般的ですが、市場に出回っているテスターを雇わなければならないという意味ではありません。 テスターに何を求めているかを慎重に検討することで、適切な候補を見つけることは完全に難しい課題ではありません。   1. テストの種類とテストへのアプローチ方法に関する基本的な知識 テスター仕事に​応募したいすべての受験者は自分が取り組んでいきているテストタイプについて基本を把握することが必要です。例えば、GUIテストとAPIテストの違いが指摘できない場合、これは候補者にとって大きなデメリットになる可能性があります。基本的な知識が不足しているのはトレーニングに費やされる時間はさておき、作業中に多くの問題につながる可能性があります。     しかし、面接官は、テスト種類の基本的な知識について質問への回答だけを踏まえて、面接結果を決定すべきではありません。これらの回答を通じて、候補者の理論的知識の把握がどのレベルかを評価することだけができます。 手動テストと自動化テストにつきまして、面接官はそれらの違いに関していくつかの質問をする必要があります。 これらの質問は、テストについて候補者全体的な知識を評価ことに役立ちます。   2. ソフトウェアテスト環境 簡単に言うと、テスト環境とはソフトウェアが正しく動作するか否かの検証作業を行う環境のことです。     テストプロジェックにおける候補者の能力を深く掘り下げたい場合は、下記にようなテスト環境について具体的な質問をする必要があります。 受験者がテスト環境をセットアップするプロセスはなんでしょうか?このプロセスは十分に徹底しているか、システムのプロセスと類似していますか? 候補者は複数のテスト環境をどのように設定しますか? テスト環境に関する気をつけるべき要素はなんでしょうか?   3. 様々な分野における候補者のソフトウェアテストに関する知識と経験 デジタルトランスフォーメーション(DX)は現在生活のあらゆる側面に関係しているのは、ソフトウェアテストの需要が段々高くなることにつながります。ソフトウェアテスト作業は金融と銀行、ヘルスケア、農業、娯楽など分野における一般的になっていきます。 特定の分野によって、ソフトウェア構造が違うので、ソフトウェアテストプロセスも異なります。     例えば、金融および銀行システムでは、面接官はセキュリティテストプロセスについて候補者に尋ねる傾向にあります。 この理由は、金融機関や組織にとって、データセキュリティが最優先事項であるからです。個人情報と財政状態は、流出リスクが極めて高いと言われています。この分野でテスターとして働きたい候補者は、各トランザクションの安全性と正確性を確認する必要があります。金融や銀行で働く企業にとって、候補者がセキュリティテストをどのように実施するかについて質問を出たしたほうがいいと思います。   4. ソフトウェアテストツール テストツールの種類がたくさんあるが、この記事ではプロジェックマネジメント支援ツールと技術に関連するツールを強調したいと思います。 まず、プロジェックマネジメント支援ツールは不具合修正と再テストの実施状況の管理、インシデントの管理や不具合の追跡などテストに関する様々なことができます。それで、面接の時、そのツールの使用に対して候補者の経験に関する質問を出ることをお勧めします。 次、技術に関連するテストツールについて、下記のような7つの主要な種類にテストツールを分ける必要があります。 検出テストツール モバイルアプリテストのツール クロスブラウザテストのツール…

機械学習向け データアノテーション のガイド

機械学習向け データアノテーション のガイド

データアノテーション の目的 機械学習 機械学習はというと、AIに内包されるもので、特定のタスクをトレーニングにより機械に実行させるものである。機械学習の手法は、教師あり学習、教師なし学習、半教師あり学習と強化学習の4選がある。 ▸教師あり学習:教師あり学習とは、学習データに正解ラベルを付けて学習する手法である。これは、事前に与えられたデータをいわば例題とみなして、それをガイドに学習を行うというのアルゴリズムである。 ▸教師なし学習:教師なし学習は、学習データに正解のラベルを付けないで学習させる手法である。つまり、機械学習モデルが自力でデータの法則性、特徴を見つけていく。 ▸半教師あり学習:半教師あり学習は、文字通りに教師あり学習と教師なし学習と共通点がある手法となっている。 ▸強化学習:強化学習とは、ある環境内におけるエージェントが、現在の状態を観測し、取るべき行動を決定する機械学習の一種。例えばゲーム業界に、この学習手法により、エージェントは、タスクの報酬を最大化する一連の意思決定を行うことができる。 手法には何選がありますが、最もよく使用されるのは教師なし学習と教師あり学習である。   教師データとは? 教師データとは、一つ一つのデータに対して付与される正解を示す情報のことである。基本的に割り当てられたタスクの実行をAIに教えるテキストで、何度も使用を繰り返して予測を微調整し、正解率を高めていく。     AI向け教師データの作成し方 (データアノテーション) ステップ1:データ収集 正しいな教師データを収集するには、まず課題の内容 とそのビジネス上の価値を理解する必要がある。 アノテーションのデータ分類については、名前から 類推して キーワードを作成し、インターネットからのデータ検索ツールを使用して、画像を検索することが できる。 または、写真、SNSの動画、Googleの衛星画像、公共のカメラ や車(Waymo、Tesla)から 無料で 収集されたデータ、または 第三者からデータを購入することも できる(データの正確性については自己責任)。 一般的なデータタイプには、画像、動画、テキスト、音声、および3Dセンサーデータがある。 画像:人、物、動物の写真。 動画:CCTVまたはカメラから記録されたテープ。 テキスト:さまざまなドキュメントの種類で数字や単語が含まれ、複数の言語で書いても使用できる。 音声:人口統計が異なる人々からの音声レコード。 3Dセンサーデータ:センサーデバイスによって生成された3Dモデル。   ステップ2:課題を把握する 課題を把握すると入力データにどんな手法を選ぶのかわかっていく。 コンピュータビジョンには、以下のようにタスクがある: ▸画像分類:入力データを分類し、画像にクラスラベルを割り当てること。 ▸物体認識(オブジェクト ディテクション):画像から検出する物体に点や線を設置、あるいは矩形(バウンディングボックス)で囲みます。そのオブジェクトが何であるかを示すタグ(クラス)と座標情報のラベル(ローカライゼーション)も付ける。 ▸領域抽出(セグメンテーション):画像をセグメンテーションした(輪郭線情報をポリゴンにより付与)後、クラスラベルを付ける。   ステップ3:データアノテーション 要件を満たすデータセットを準備したら、次は どのような方法で アノテーションをするのか を決める必要がある。データは 決まった手法に応じて 処理されていく。例えば、分類の場合、「ラベル」はクロールするプロセスでインターネットからデータを見つける時に使用されるキーワードである。 その後、ツールを使用して 画像注釈(画像のラベルとメタデータを設定)を実行する必要がある。 一般的なツールには Comma Coloring,…

テスト自動化アウトソーシング :投資対効果 (ROI) を最大化するの5つのステップ

  最近、アウトソーシングは企業のコストを削減するのに役立つだけでなく、戦略的管理のための効果的な選択にもなりました。典型的な例は、テスト自動化アウトソーシングです 。企業の製品やアプリの品質を向上させ、ビジネスリスクを軽減するのに役立ちます。テスト自動化と品質保証で10年以上の経験を持つLQAのテストチームは、ROIを最大化するためのテスト自動化アウトソーシングに関する5つのヒントを提供します。   1. エンゲージメントモデルを調べ テスト自動化アウトソーシングモデルのタイプを決定するべき。 アウトソーシングプロジェクトをどの程度管理したいのかを考えましょう。より細かく制御し、リスクを軽減するために作業をより小さなプロジェクトに分割できるようにしたい場合は、インクリメンタルアウトソーシングが最適です。ただし、コアビジネスに集中し、テストアクティビティを第三者に任せたい場合は、トータルアウトソーシングが最良の選択だと思います。 ベンダーのパフォーマンスを管理するプロジェクトマネージャー(PM)を任命すること。 オンサイトモデルとオフショアモデルのどちらを採用する場合でも、プロジェクトマネージャーをクライアント側に派遣することで、ベンダーの能力を評価し、ベンダーのパフォーマンス管理プロセスを設定し、SLA義務の履行と適時性を追跡できます。   2.独立で高能力のベンダーを選択 同じ初期投資で、ROIの数値はベンダーによって異なります。独立品質保証会社は、客観性と徹底性を提供できるため、お気に入りのベンダーになりつつあります。さらに、テストに重点を置いているため、独立したQAベンダーは、適正価格で最高品質の結果を引き出すことができます。独立ベンダーは専門知識を提供できることが: 全体のテスト自動化戦略を作成すること。 柔軟なテスト自動化アーキテクチャを設計、開発、維持すること。 最良のテスト自動化フレームワークを選択するのアドバイス。 UIとAPIレベルの両方で自動化をサポートすること。     3.水平方向のコラボレーションを設定 双方にとってより有益で便利なものにするために、ベンダーとのコラボレーションは水平レベルで実行する必要があります。 詳しくは以下のように: 当社側 コラボレーションの側面 ベンダー側 CTOあるいはCEO 戦略的整合、長期的な優先順位付け CTOあるいはCEO ソフトウェア開発/ QAチームリーダー サービスレベルアグリーメント(SLA)の調整、KPIレビュー、契約の修正 アカウントマネージャー プロジェクトマネージャ QA活動の優先順位付けとスケジューリング、リスク管理、プロセス調整 テスト自動化マネージャー ビジネス分析、ソフトウェア開発、品質保証エンジニア 毎日のコラボレーション テスト自動化エンジニア     4. Establish performance measurement metrics テスト自動化のメリットの1つは、簡単な測定と測定基準であいまいさを減らすことです。 作業単位は小さな成果物(1つのテストケース)であるため、1人あたり、1日に自動化されたテストの数を簡単に測定し、メンテナンスにどのくらいの労力が費やされているかを把握し、最終的にROIの決定に到達できます。 メトリックの確立には、次のアクティビティを含める必要があります: ベンダーとのSLAおよびパフォーマンスメトリックを設定すること:パートナーシップを開始する前に、両当事者が協力して包括的なSLAを把握する必要があります。 さらに、契約には、ベンダーの責任と、サービスを測定するKPIも明確に記載するべきだと思います。 テスト自動化のアウトソーシングで発生する可能性のあるリスクを軽減すること:作業プロセスでは、技術的およびリソース関連のリスクにより、追加のコストとサービス提供の遅延が発生する可能性があります。特定されたリスクについて、管理者は軽減および緊急時対応戦略を策定するべきです。具体的な例の1つは、プロジェクトの負荷が変動する場合、マネージャーは、プロジェクトの負荷の事前定義された制限内での柔軟なリソース割り当ての可能性についてベンダーと交渉する必要があります。 SLA条件が遵守され、満たされていることを確認:プロジェクトマネージャーは、テスト結果レポートを定期的に確認する必要があります。 テストカバレッジや自動テストあたりのコストなどの指標の組み合わせに注意を払うことが大事です。   5.…