機械工業雜誌

說明說明說明說明說明說明說明說明說明說明說明說明

三維工件堆疊資料庫之建構與應用

刊登日期：2015/07/01

摘要：方本文介紹了一個三維工件堆疊資料庫的建構方法。藉由整合3D繪圖引擎和物理模擬的Gazebo模擬平台，我們能建立隨機堆疊物件的場景，並實現一個虛擬的3D感測器，取得堆疊工件的點雲資料。同時，每個堆疊工件的真實姿態，也很容易地從模擬平台中取得，建立完整的測試資料集。最後，我們利用這些資料，進行3D姿態估測演算法的量化評估。這些評估結果，對於3D姿態估測演算法應用於隨機容器物件夾取上，除了讓人清楚使用上的優點和限制，也可作為進一步改善演算法的方向。

Abstract: This article introduces the method for the construction of the 3D stacked objects database (SOD). By using the Gazebo simulator which integrates 3D graphics engine and physics simulation engine, we can create scenes containing random stacked objects, and implement a virtual 3D sensor to capture the point clouds of the scenes. At the same time, the ground truth poses of stacked objects can be retrieved from the simulator. The database comprises both point clouds and the associate poses. Moreover, we evaluate a 3D pose estimation algorithm by using SOD as an application example. The result shows not only the advantages and limitations in random bin picking application, but also as the direction for further improvement of the algorithm.

關鍵詞：姿態估測、數位模擬、容器內夾取

Keywords：Pose Estimation, Digital Simulation, Bin-Picking

前言
近年來，視覺辨識、定位、量測與檢測等方法，已經廣泛的被應用在各個領域，像是車輛、機械自動化設備、機器人等等。在以往的視覺應用中，開發一個視覺演算法的流程，通常會先了解標的物件和需要達成的規格，而在這些規範之下，開發出合適的視覺演算法，以達到最佳的表現和效率。然而，今日視覺應用所面臨的挑戰，往往是少量多樣的工件，並且需要達到同樣的效能（如定位精度）。因此，視覺演算法從以往的單一適用性，慢慢走向具備高彈性的泛用型演算法。

開發泛用型演算法有一定的困難度，因為對各式各樣的物件，同一個演算法仍會面臨一定的侷限性。為了評估演算法在開發中或完成後的結果，開發人員會盡可能地嘗試許多不同的物件，並套用許多不同的測試條件、參數等，建立出一系列量化的評估結果，用來展現演算法的能力。但是，在許多類似目標的視覺演算法或研究中，像是影像分類，通常會使用各自挑選的測試資料集，這使得即便是量化的評估結果，仍然無法直觀的進行比較。

為了解決這個問題，許多學術或研究單位，製作了各種類型的影像資料庫，試圖提供全面性、標準化的測試資料集。這些資料庫通常包含數千甚至到數百萬的影像資料，並且根據影像的屬性，如影像內容物的類別、材質的種類、物體的方向角度等等，加以標示並分類。在這些資料庫之中，有一部分是專門收集為特定應用的影像，如人臉辨識（CMU PIE [1]）、指紋辨識（FVC2004 [2]）、影像前景和背景分割（BSDS500 [3]）；另一部分屬於泛用的影像集合，通常會用在物件分類、檢索、或辨識使用，小型的資料庫如PASCAL [4]、MSRC [5]，到目前涵蓋數量最大的ImageNet[6]，目標在提供視覺演算法，一個非常接近真實環境的挑戰和使用情境。

相較於2D影像資料庫，3D物件的資料庫受限於感測技術成熟度和物件的不同尺度，在數量與應用範圍就比較小。資料庫的組成多半為3D網格模型、CAD模型，或是3D點雲資料。如同2D影像資料庫一樣，這些內容也會根據預先定義的標籤加以分類。較早期的三維資料庫，如PSB [7]，內容以CAD模型為主，適用在3D物件識別、檢索的演算法比較上。近年來，成熟且好用的3D感測器，像是Kinect感測器，降低了3D資料蒐集的門檻[8]。其他如結合RGB-D資料的人臉辨識資料庫[9]，和一個大尺度、適合許多如3D物件辨識、分類問題的3D物件資料庫BigBIRD [10]。

儘管已經有許多樣的資料庫存在，但這些資料庫多半設計為辨識、分類、分割等3D視覺應用演算法。在目前工業自動化的應用中，隨機容器物件夾取（random bin picking, RBP）是一個相當具有挑戰性的問題，其中的核心技術，3D姿態估測演算法[11-14]，已經有許多的方法被提出。然而，這些演算法並沒有可靠的量化評估結果。主要的原因是不容易定義物體在三維空間中的姿態，也無法取得絕對真實的姿態資訊。因此，本文利用數位模擬的方式，產生三維物件堆疊的資料庫，提供每個物件的姿態資訊，讓3D姿態估測演算法能使用這些測試資料，進行量化的評估。在實驗結果中，我們將呈現Wu等作者[14]的姿態估測方法，利用本資料庫所得到的評估結果。

上一篇 - 工業用乙太網路介紹

下一篇 - 機器人視覺定位技術與取放應用

回文章內容列表