溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

pig運行方法是什么

發布時間：2021-12-22 17:25:46 來源：億速云閱讀：238 作者：iii 欄目：云計算

本篇內容主要講解“pig運行方法是什么”，感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷，實用性強。下面就讓小編來帶大家學習“pig運行方法是什么”吧!

Pig是作為客戶端運行的程序，你需要將其連接到本地Hadoop或者集群上。當安裝Pig之后，有三種執行pig程序的方法：pig腳本（將程序寫入.pig文件中），Grunt（運行Pig命令的交互式shell環境）和嵌入式方式。
records = Load ‘sample.txt’ as (year:chararray, temperature:int, quality:int);
filter_records = FILTER records BY temperature != 9999 AND quality == 0;
group_records = GROUP filter_records BY year;
max_temp = FOREACH group_records GENERATE group, MAX(filter_records.temperature);
DUMP max_temp;
生成上面程序的創建的數據集結構： grunt> ILLUSTRATE max_temp;
Pig和數據庫的比較：
1）Pig是數據流編程語言，而SQL是一種描述型編程語言。Pig是相對于輸入的一步步操作，其中每一步都是對數據的一個簡單的變換；而SQL語句是一個約束的集合，這些約束結合在一起定義了輸出。Pig更像RDBMS中的查詢規劃器。
2）RDBMS把數據存儲在嚴格定義了模式的表內，但pig對數據的要求更寬松，可以在運行時定義模式，而且是可選的。
3）pig對復雜、嵌套數據結構的支持更強；
4）Pig不支持事務和索引，也不支持隨機讀和幾十毫秒級別的查詢，它是針對數據批量處理的。
5）Hive是介于Pig和RDBMS之間的系統。Hive以HDFS為存儲，但是查詢語言是基于SQL的，而且Hive要求所有數據必須存儲在表中，
表必須有模式，而模式由Hive管理。但Hive允許為預先存在HDFS中的數據關聯一個模式，因此數據加載步驟是可選的。

到此，相信大家對“pig運行方法是什么”有了更深的了解，不妨來實際操作一番吧！這里是億速云網站，更多相關內容可以進入相關頻道進行查詢，關注我們，繼續學習！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
怎么使用基于CM安裝的CDH卸載
下一篇新聞：
mysql中出現1053錯誤怎么辦

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女