クラスタリング (clustering) とは与えられた複数のサンプルを類似度を指標に自動的に分類するための手法であり,さまざまな類似度の算出方法が提案されている.似たデータをもつサンプル同士から順に集合 (クラスター) を形成する.与えられたデータだけを頼りに計算するものを 「教師なし(Non-supervised)」 とよぶ.