Apache Pig是MapReduce的一個抽象,它是一個工具/平臺,用于分析較大的數(shù)據(jù)集,并將它們表示為數(shù)據(jù)流。
Apache Pig是MapReduce的一個抽象,它是一個工具/平臺,用于分析較大的數(shù)據(jù)集,并將它們表示為數(shù)據(jù)流。Pig通常與Hadoop 一起使用;我們可以使用Pig在Hadoop中執(zhí)行所有的數(shù)據(jù)處理操作。
本教程面向所有從事Hadoop的專業(yè)人員,他們希望執(zhí)行MapReduce操作,而不必在Java中鍵入復(fù)雜的代碼。
為了充分掌握本教程,你應(yīng)該充分了解Hadoop和HDFS命令的基礎(chǔ)知識,而如果你善于SQL會更有幫助。