awk 数组排序多种实现方法「建议收藏」

awk 数组排序多种实现方法「建议收藏」由于awk数组,是关联数组。for…in循环输出时候,默认打印出来是无序数组。 [chengmo@localhost~]$awk’BEGIN{info=”thisisatest”;split(info,tA,””);for(kintA){printk,tA[k];}}’4test1this2is3a 如果需要按照顺序输出,通过

大家好,又见面了,我是你们的朋友全栈君。

由于awk数组,是关联数组。for…in循环输出时候,默认打印出来是无序数组。

 

[chengmo@localhost ~]$ awk ‘BEGIN{info = “this is a test”;split(info,tA,” “);for(k in tA){print k,tA[k];}}’
4 test
1 this
2 is
3 a

 

如果需要按照顺序输出,通过键值定位方式输出。

[chengmo@localhost ~]$ awk ‘BEGIN{info = “this is a test”;slen=split(info,tA,” “);for(i=1;i<=slen;i++){print i,tA[i];}}’      
1 this
2 is
3 a
4 test

 

一、通过内置函数(asort,asorti使用) awk 3.1以上版本才支持

  1. asort使用说明

srcarrlen=asort[srcarr,dscarr] 默认返回值是:原数组长度,传入参数dscarr则将排序后数组赋值给dscarr.

 

[chengmo@localhost ~]$ awk ‘BEGIN{

a[100]=100;
a[2]=224;
a[3]=34;
slen=asort(a,tA);
for(i=1;i<=slen;i++)
{print i,tA[i];}
}’
1 34
2 100
3 224

asort只对值进行了排序,因此丢掉原先键值。

 

2、asorti 使用说明

[chengmo@localhost ~]$ awk ‘BEGIN{

a[“d”]=100;
a[“a”]=224;
a[“c”]=34;
slen=asorti(a,tA);
for(i=1;i<=slen;i++)
{print i,tA[i],a[tA[i]];}
}’
1 a 224
2 c 34
3 d 100

asorti对键值 进行排序(字符串类型),将生成新的数组放入:tA中。

 

 

二、通过管道发送到sort排序

[chengmo@localhost ~]$awk ‘BEGIN{

a[100]=100;
a[2]=224;
a[3]=34;
for(i in a)
{print i,a[i] | “sort -r -n -k2”;}
}’
2 224
100 100
3 34

 

通过管道,发送到外部程序“sort”排序,-r 从大到小,-n 按照数字排序,-k2 以第2列排序。通过将数据丢给第3方的sort命令,所有问题变得非常简单。如果以key值排序 –k2 变成 -k1即可。

[chengmo@localhost ~]$ awk ‘BEGIN{

a[100]=100;
a[2]=224;
a[3]=34;
for(i in a)
{print i,a[i] | “sort -r -n -k1”;}
}’
100 100
3 34
2 224

 

 

三、自定义排序函数

  • awk自定义函数结构:

function funname(p1,p2,p3)

{

    staction;

    return value;

}

以上是:awk自定义函数表示方式,默认传入参数都是以引用方式传入,return值,只能是字符型或者数值型。 不能返回数组类型。 如果返回数组类型。需要通过形参 方式传入。再获得。

awk返回数组类型

awk 'function test(ary){
 for(i=0;i<10;i++){
  ary[i]=i;
 }
 return i;
}
BEGIN{
 n=test(array);
 for(i=0;i<n;i++){
  print array[i];
 }
}
'
  • 排序函数

#arr 传入一维数组

#key 排序类型 1是按照值排序 2按照键值

#datatype 比较类型 1按照数字排序 2按照字符串排序

#tarr 排序返回的数组

#splitseq 分割字符串 数组中键与值之间分割字符串

#return 数组长度

#实现思路,将原始数组a[‘a’]=100 排序后变成 a[1]=a分隔符100 ,然后按照下标递归显示内容。 本排序使用冒泡方式进行。

 

function sortArr(arr,key,datatype,tarr,splitseq)
{

    if(key ~ /[^1-2]/)
    {return tarr;}
    for(k in arr)
    {

      tarr[++alen]=(k””splitseq””arr[k]);
    }

    for(m=1;m<=alen;m++)
    {

        for(n=1;n<=alen-m-1;n++)
        {

            split(tarr[m],tm,splitseq);
            split(tarr[n+1],tn,splitseq);

                tnum=tarr[m];
            if(datatype==1)
            {

                if(tm[key]+0<tn[key]+0)
                {

                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
            else
            {

                if((tm[key]””) < (tn[key]””))
                {

                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
        }
    }
    return alen;
}

 

完整代码如下:

[chengmo@centos5 ~]$ awk ‘BEGIN{

a[“a”]=100;
a[“b”]=110;
a[“c”]=10;
splitseq=”%%”;
alen=sortArr(a,2,1,tarr,splitseq);
for(m=1;m<=alen;m++)
{

    split(tarr[m],ta,splitseq);
    print m,ta[1],ta[2];
}
}
function sortArr(arr,key,datatype,tarr,splitseq)
{

    if(key ~ /[^1-2]/)
    {return tarr;}
    for(k in arr)
    {

      tarr[++alen]=(k””splitseq””arr[k]);
    }

    for(m=1;m<=alen;m++)
    {

        for(n=1;n<=alen-m-1;n++)
        {

            split(tarr[m],tm,splitseq);
            split(tarr[n+1],tn,splitseq);

                tnum=tarr[m];
            if(datatype==1)
            {

                if(tm[key]+0<tn[key]+0)
                {

                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
            else
            {

                if((tm[key]””) < (tn[key]””))
                {

                     tarr[m]=tarr[n+1];
                     tarr[n+1]=tnum;
                }
            }
        }
    }
    return alen;
}

1 b 110
2 a 100
3 c 10

 

 

以上是awk数组排序一些方法。对于少量数据排序,就性能而言,使用自定义函数性能要高,不需要另外再开启进程。对于大量数据,排序第2种方法还是很不错的。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/161654.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • java算法大全_java经典算法_算法面试题大全含答案

    java算法大全_java经典算法_算法面试题大全含答案1、Java中用到的线程调度算法是什么?2、java二叉树算法面试题大全含答案3、java笔试手写算法面试题大全含答案4、java递归算法练习:使用递归算法写个程序计算n!5、JVM的常见垃圾回收算法6、《java算法大全》第一期7、《java算法大全》第三期8、《java算法大全》第二期9、《java算法大全》第五期10、《java算法大全》第四期11、《java经典算法》之…

  • ArcGis二次开发遇到的问题

    ArcGis二次开发遇到的问题在我们刚开始利用.net对arcgis进行二次开发时,费了牛鼻子劲安装好了arcgisengine,也在vs中建立了新项目,拖进去了工具条控件,主页面控件,想要欣赏一下成果的时候,发现一点击启动就报错了:查阅相关资料后发现,在主程序中加入这样两行代码,给程序进行授权,就可以顺利运行了。在这里强烈推荐牟乃夏老师的一系列书籍,从arcgis基础知识到开发自己的gis软件,非常有用。后面有时间我会…

  • 视频监控传输设备_网络视频监控平台

    视频监控传输设备_网络视频监控平台高清视频传输系统传输系统是整个社会治安视频监控网络的数据传送平台,承担着平安城市从接入点中心以之间的视频数据传输重担,是搭建整个监控网络的血脉,因此,治安视频监控网络传输系统将采用全数字化的计算机网络传输系统,从监控点的接入到监控中心的数据汇聚完全采用全数字化通道,整个传输网络结构主干万兆汇聚,千兆到监控点接入,户外接入层交换机选用宽温宽压工业级交换机产品,保证视频数据的无阻塞、无延迟传输以及与原…

  • 程序员需要学数学吗?「建议收藏」

    程序员需要学数学吗?「建议收藏」程序员需要学数学吗?

  • 对LARS(Least Angle Regression)的简单理解

    对LARS(Least Angle Regression)的简单理解前言我在本科的时候接触过用LASSO筛选变量的方法,但了解不多。这几天在公司实习,学习到特征选择,发现还有个LARS是经常和LASSO一起被提起的,于是我临时抱佛脚,大概了解了一下LARS的原理。在看文章的时候发现很多人提到SolutionPath这样一个概念,感觉很费解,后来参阅了Efron等人的&quot;LeastAngleRegression&quot;论文,总算是明白了一些。不过本人由于懒,后面数学…

  • dubbo框架RPC过程详解「建议收藏」

    转载地址:http://www.cnblogs.com/LBSer/p/4853234.html你应该知道的RPC原理  在学校期间大家都写过不少程序,比如写个helloworld服务类,然后本地调用下,如下所示。这些程序的特点是服务消费方和服务提供方是本地调用关系。  而一旦踏入公司尤其是大型互联网公司就会发现,公司的系统都由成千上万大大小小的服务组成,各服务部署在不同的机器上,由不同的

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号