文在寅政権
文在寅政権時代に1000億ウォン投じて作成したAIデータ、34%はデタラメだった
韓国のある民間IT業者が2020年、韓国政府から「人工知能(AI)学習用データ構築事業」を受注した。卵・牛肉など畜産物の写真数万件で構成された蓄積データを作成する業務だった。政府がその蓄積データを一般公開すれば、企業がそれをAIに学習させ「卵の外見だけで卵の品質を判定するAI」「牛肉の外見だけで、等級分類できるAI」などを開発することができるものだった。
しかし、この業者が提出した蓄積データはAI学習に全く使い物にならない「ゴミデータ」だった。政府はA~D等級の卵の写真をそれぞれ1万6000枚、計6万4000枚取りまとめることを要求していたが、問題の業者が提出した写真はB等級の卵の写真43枚にすぎなかった。このほか、牛肉の写真も5等級ごとに各1万6000枚ずつ計8万枚を提出なければならなかったが、1等級の写真は皆無で、2・3等級の牛肉の写真だけ数千枚を提出した。1等級の牛肉の写真がないデータでAIを学習させ、1等級と2・3等級の牛肉を区別させることなどできない。それでも同社は政府から19億ウォン(約2憶1800万円)を受け取った。
この業者は文在寅(ムン・ジェイン)政権が「韓国版ニューディール」という名目で2020年から推進した「AIデータ事業」に参加した。監査院は23日、2020年から25年までに約2兆5000億ウォンが投じられる同事業で、最初の2年間に作成された蓄積データ360件のうち122件(33.8%)の品質が基準を満たしておらず、AI学習には使えない状態だったと発表した。不合格の蓄積データを作成するのに要した費用は1148億ウォンだった。
他社が作成したサッカー競技の動作に関するデータには写真が数万件含まれていたが、 一部の写真には写真のの動作がどんな動作なのかに関する説明が欠落していた。チャージをかけているのか、スライディングをしているのか、反則なのか、正常なプレーなのかなどの表示が全くされていなかった。また別の業者は、聴力検査の結果データを10万8167件集めたが、資料に対する説明が全て欠落していた。これもデータとしては役に立たない。それでも両社は政府からそれぞれ19億ウォン、18億ウォンを受け取った。
監査院はAIデータ事業を担当した科学技術情報通信部傘下の韓国知能情報社会振興院(知能情報院)による事業管理がずさんだったことが原因だと指摘した。同院は発注先企業が提出した蓄積データをデータ公開サイトにそのまま掲載しており、追加発注も繰り返していた。一部業者は事業費として受け取った19億ウォンのうち13億9000万ウォンを横領した。監査院関係者は本紙の電話取材に対し、「政府がAIデータ事業の規模を2020年に突然それまでの7倍以上に増やし知能情報院が業務を処理しきれなくなったとみられる」と説明した。
政府と地方自治体が進めるさまざまな情報化事業に関連する行政処理が事実上手作業で行われてきた事実も今回の監査で明らかになった。監査院によれば、中央行政機関と地方自治体は情報化事業の重複実施を回避するため、現在行っている事業に関する詳細を知能情報院に提出しなければならない。ところが各機関と地方自治体の担当者は事業の詳細内訳に関する文書をワープロとエクセルでいちいち作成し、それを公文書に添付して知能情報院に送っていた。知能情報院の職員は公文書を一つ一つ開き、内訳を書き写し、内容に誤りがある場合には該当機関の担当者に電話して修正を加えていた。こうした方法で処理した文書は2018年から22年までの5年間に6万309件に上った。
知能情報院と科学技術情報通信部もこうした業務方式が極めて非効率的だということを知っていた。そのため、作業を自動化するシステム構築を目指したが、行政安全部が運営する汎政府ポータルサイトと機能が重複するとの反対を受け失敗した。しかし、実際には自動化システムに必要な機能は汎政府ポータルサイトに含まれなかった。
監査院は科学技術情報通信部に対し、AIデータ事業で作成された蓄積データを点検し、不良データを提出したり、費用を横領したりした業者を特定し、事業費を回収することなどを求めた。また、科学技術情報通信部と行政安全部には、情報化事業の行政業務を汎政府ポータルサイトで処理する方向で協議するよう指示した。科学技術情報通信部関係者は「監査院が品質が基準に達しないと指摘した蓄積データに対し、業者に補完を要求し、大多数のデータの補完がまもなく完了する予定だ」と説明した。
金耿必(キム・ギョンピル)記者