製造業における「データエンジニアリング」とは??

AIデータセントリック部では、10年前から行っているアノテーション事業を通して「データの価値化とは?」というテーマに取り組んできております。
前回取り上げさせて頂いた「データエンジニアリング」という概念のお話しですが、つい先日パシフィコ横浜で日鉄エンジニアリング様と基調講演で登壇させて頂いた際に、「製造業におけるデータエンジニアリング」について講演させて頂きましたので、ここでも軽く触れさせて頂きます。
>EdgeTech+2024 11/23基調講演登壇
⼯場/プラントDXの課題と未来に向けた備えとは︖
基調講演で発表資料を作成している時の参考に「データエンジニアリングの基礎」(オライリー・ジャパン 2024/3)に書かれていた「データエンジニアリングライフサイクル」の概要図を使って説明させて頂いたのですが、「データエンジニアリング」の概念はSaaS系のサービス事業者の中で広まったキーワードの為、その概念もやはりSaaSよりとなっているように書籍を読んで感じました。
まず、青字の部分がオライリーの書籍に書かれていたデータエンジニアリングライフサイクルの範囲です。
我々が10年製造業でデータに関わって来た概念を入れ込もうとする時に、赤字の部分「目的」「データ収集」がとても重要な役割を持っていると感じた為、基調講演では上記の部分を追加させて頂きました。
簡単に説明しますと、製造業における「データエンジニアリング」において、例えば「アノテーション」の依頼があった際に、「アノテーションの目的」、もしくは何をどのくらいの精度で認識すべきかをAIのエンジニアと議論をしながら、そのアノテーション仕様を固めていきます。
細かくアノテーションをつけるケースが良い場合と、ざっくりでも多くのデータにアノテーションつければいいケースなど、目的によってその方針は様々だったりします。それと、多くのお客様で困られているのは、そのデータの収集が、サーバーに勝手に入ってくるデータでは無く、目的にあったデータを効率的に取得、収集しなければいけないことも、製造業におけるデータのめんどうくささを引き立てている状況です。
【アノテーション事例】
そのような場面でも、「目的」を理解して、効率よく網羅的にデータを収集できると、その後の後段の作業効率が一気に上がっていくのですが、大抵の場合はとりあえずデータ収集してしまうケースが多いので、ストレージもパンパンに膨れ、さらにそのデータを調べながら必要なデータを選別する作業に追われ、現場が疲弊してしまうケースが非常に多く見受けられます。
上記は一例ではございますが、このようなケースが製造業側でAIの社会実装が増えるとますますその課題が顕著化していくと思いますので、是非顕著化する前にブライセンにご相談いただければ幸いです。
■ブライセンアノテーションマネジメントサービス
https://annotation.brycen.co.jp/
■データセット販売
https://annotation.brycen.co.jp/service/dataset.html
■MLOpsサービス
https://annotation.brycen.co.jp/service/mlops.html
■AI DataCentricサービス:
https://annotation.brycen.co.jp/?utm_source=newsletter&utm_medium=email&utm_campaign=241120
■COOOLaWESサービスページ:
https://cooola.jp/lp/wes/
■xTECHソリューションサービスページ:
https://xtech.brycen.co.jp/