首页 > 社交 > 科普中国

大数据组件常用命令

常驻编辑 科普中国 2022-10-20 函数   组件   字符   元素   命令   参数   日期   类型   功能   文件   时间   常用命令   数据


Knu拜客生活常识网

4个By


Knu拜客生活常识网

(1)Order ByKnu拜客生活常识网


Knu拜客生活常识网

全局排序,只有一个Reducer。Knu拜客生活常识网


Knu拜客生活常识网

(2)Sort ByKnu拜客生活常识网


Knu拜客生活常识网

分区内有序。Knu拜客生活常识网


Knu拜客生活常识网

(3)Distrbute ByKnu拜客生活常识网


Knu拜客生活常识网

类似MR中Partition,进行分区,结合sort by使用。Knu拜客生活常识网


Knu拜客生活常识网

(4) Cluster ByKnu拜客生活常识网


Knu拜客生活常识网

当Distribute by和Sorts by字段相同时,可以使用Cluster by方式。Cluster by除了具有Distribute by的功能外还兼具Sort by的功能。但是排序只能是升序排序,不能指定排序规则为ASC或者DESC。Knu拜客生活常识网


Knu拜客生活常识网

在生产环境中Order By用的比较少,容易导致OOM。Knu拜客生活常识网


Knu拜客生活常识网

在生产环境中Sort By+ Distrbute By用的多。Knu拜客生活常识网


Knu拜客生活常识网

排序函数


Knu拜客生活常识网

(1)RANK()Knu拜客生活常识网


Knu拜客生活常识网

排序相同时会重复,总数不会变Knu拜客生活常识网


Knu拜客生活常识网

1
1
3
3
5


Knu拜客生活常识网

(2)DENSE_RANK()Knu拜客生活常识网


Knu拜客生活常识网

排序相同时会重复,总数会减少Knu拜客生活常识网


Knu拜客生活常识网

1
1
2
2
3


Knu拜客生活常识网

(3)ROW_NUMBER()Knu拜客生活常识网


Knu拜客生活常识网

会根据顺序计算Knu拜客生活常识网


Knu拜客生活常识网

1
2
3
4
5


Knu拜客生活常识网

正则表达式

相关阅读:

  • tan30度等于多少(三角函数必背公式)
  • cos30度是多少(三角函数所有公式大全)
  • 如何插入函数(将多个单元格内容合并)
  • 怎么定义函数(matlab中script和function区别)
  • excel怎么用函数 电脑表格怎样设置函数公式?
  • 函数图像怎么画 二次函数图像生成器?
  • C++|深入理解智能指针
  • typescript4.7
  • 「技术干货」Linux内核代码追踪之UDP调用过程
  • 单片机时间片轮询任务调度的实现方法
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。

    符号Knu拜客生活常识网

    功能Knu拜客生活常识网

    /Knu拜客生活常识网

    做为转义,即通常在“/”后面的字符不按原来意义解释,如/b/匹配字符“b”,当b前面加了反斜杠后//b/,转义为匹配一个单词的边界。-或-对正则表达式功能字符的还原,如““匹配它前面元字符0次或多次,/a/将匹配a,aa,aaa,加了"/"后,/a//将只匹配”a“。Knu拜客生活常识网

    ^Knu拜客生活常识网

    匹配一个输入或一行的开头 ,/^a/匹配”an A“,而不匹配”An a“Knu拜客生活常识网

    $Knu拜客生活常识网

    匹配一个输入或一行的结尾,/a$/匹配”An a“,而不匹配”an A“Knu拜客生活常识网

    *Knu拜客生活常识网

    匹配前面原字符0次或多次,/ba*/将匹配b,ba,baaKnu拜客生活常识网

    +Knu拜客生活常识网

    匹配前面元字符1次或多次,/ba*/将匹配ba,ba,baaaKnu拜客生活常识网

    ?Knu拜客生活常识网

    匹配前面元字符0次或1次,/ba?/将匹配b,baKnu拜客生活常识网

    (x)Knu拜客生活常识网

    匹配x保存x在名为$1…$9的变量中Knu拜客生活常识网

    {n}Knu拜客生活常识网

    精确匹配n次Knu拜客生活常识网

    {n,}Knu拜客生活常识网

    匹配n次以上Knu拜客生活常识网

    {n,m}Knu拜客生活常识网

    匹配n-m次Knu拜客生活常识网

    [xyz]Knu拜客生活常识网

    字符集(character set),匹配这个集合中任一一个字符(或元字符)Knu拜客生活常识网

    [^xyz]Knu拜客生活常识网

    不匹配这个集合中的任何一个字符Knu拜客生活常识网

    [/b]Knu拜客生活常识网

    匹配一个退格符Knu拜客生活常识网

    /bKnu拜客生活常识网

    匹配一个单词的边界Knu拜客生活常识网

    /BKnu拜客生活常识网

    匹配一个单词的非边界Knu拜客生活常识网

    /dKnu拜客生活常识网

    匹配一个数字字符,//d/=/[0-9]/Knu拜客生活常识网

    /DKnu拜客生活常识网

    匹配一个非数字字符,//D/=/[^0-9]/Knu拜客生活常识网

    /nKnu拜客生活常识网

    匹配一个换行符Knu拜客生活常识网

    /rKnu拜客生活常识网

    匹配一个换行符Knu拜客生活常识网

    /SKnu拜客生活常识网