python的sorted
读入后,要进行组内排序,按groupseq字段排序后,然后统计前后两个项的个数,累加到全局。
sorted函数使用如下:
def sortlist(alllist):
sorted_key1_1=sorted(alllist,key=lambda k:k['groupseq'])
return sorted_key1_1
keylist = readline()
for key in keylist:
sortlist=(keylist[key])
全段代码如下
#!/usr/bin/python
# -*- coding: utf-8 -*-
#vim set ts=4 expandtab
import sys
keylist={}
def readline():
global keylist
filecontent= open('g:\\test.txt','r')
for line in filecontent.xreadlines():
#for line in sys.stdin:
line.strip()
items=line.split("\t")
count=0
appid = items[count]
count= count+1
app_version = items[count]
count= count+1
act_name=items[count]
count=count+1
groupkey=items[count]
count=count+1
ggg=items[count]
groupseq=int(ggg)
count=count+1
act_dur=items[count]
act_dur.strip()
count=count+1
key1 = "\t".join((appid,app_version,groupkey))
value1={}
value1['act_name']=act_name
value1['groupseq']=groupseq
value1['act_dur']=act_dur
if not key1 in keylist:
keylist[key1]=[]
keylist[key1].append(value1)
#it="\t".join((appid,app_version,groupkey,act_name,groupseq,act_dur))
#print it.strip()
#return keylist
def sortlist(alllist):
sorted_key=sorted(alllist,key=lambda k:k['groupseq'])
#print sorted_key
#print type(sorted_key)
return sorted_key
if __name__ == '__main__':
countall={}
duration={}
readline()
for keys in keylist.keys():
sorted_list=sortlist(keylist[keys])
#print sorted_list[0]
length=len(sorted_list)
#for value in sorted_list:
prev_page=""
for i in range(length):
current_page = sorted_list[i]['act_name']
if "unknown" == current_page:
prev_page = current_page
#continue
else:
num=sorted_list[i]['act_dur']
count_duration=float(num.strip())
allkeys=keys.split("\t")
keycount='\t'.join((allkeys[0],allkeys[1],prev_page,current_page))
if not keycount in countall:
countall[keycount]=0
countall[keycount]+=1
if not keycount in duration:
duration[keycount]=0
duration[keycount] += count_duration
if current_page == "exit":
break
prev_page = current_page
for key_cou in countall:
output="\t".join((key_cou,str(countall[key_cou]),str(duration[key_cou])))
#output = "\t".join((key_cou,str(countall[key_cou])))
print output.strip()
这里的列表中,元素为字典。用key传函数,参数为x["key],这里的x在运行时,会被赋成列表中每个字典对象
f = [{'name':'abc','age':20},{'name':'def','age':30},{'name':'ghi','age':25}]
def age(s):
return s['age']
print sorted(f,key = age)#列表按f中字典的age从小到大排序。也就是说,传给s的是每个字典对象,s是一个字典形参,调用s["key"],则按key排序每个子元素。
也可以:print sorted(f,key = lambda x:x["name"])。#lambda见下面解释使用时,相当于调用key(x)这个函数,其中x被赋值为传入的对象,在这里是每个子对象字典。返回值为x[0],而正是按这个返回值排序。
结果如下:
[{'age': 20, 'name': 'abc'}, {'age': 25, 'name': 'ghi'}, {'age': 30, 'name': 'def'}]
lambda这个匿名函数,使用如下:
m = lambda x,y,z: (x-y)*z#x是参数,函数名是标示符m
print m(3,1,2)#使用时,标示符m作为参数名,,x,y,z作为参数传入。
结果是4
总结,m为函数名,xyz为形参,表达式为返回值
而字典排序:
sl={'b':2,'a':1,'d':4,'c':3}
print sorted(sl,key=lambda x:x[0])#等同于:print sorted(sl,key=lambda x:x
['a', 'b', 'c', 'd'],注意如果是x[1]就报错了。
python对容器内数据的排序有两种,一种是容器自己的sort函数,一种是内建的sorted函数。
不同在于sort是在原位重新排列列表,而sorted()是产生一个新的列表:
--------------------------------sorted---------------------------------------
>>> help(sorted)
Help on built-in function sorted in module __builtin__:
sorted(...)
sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
---------------------------------sort----------------------------------------
>>> help(list.sort)
Help on method_descriptor:
sort(...)
L.sort(cmp=None, key=None, reverse=False) -- stable sort *IN PLACE*;
-----------------------------------------------------------------------------
>>> print sorted([5, 2, 3, 1, 4])
[1, 2, 3, 4, 5]
>>> L = [5, 2, 3, 1, 4]
>>> L.sort()
>>> print L
[1, 2, 3, 4, 5]
def lastchar(s):
return s[-1]
e = ['abc','b','AAz','ef']
sorted(e,key = lastchar) #自定义函数排序,lastchar为函数名,这个函数返回列表e中每个元素的最后一个字母
['b', 'abc', 'ef', 'AAz'] #sorted(e,key=lastchar)作用就是 按列表e中每个元素的最后一个字母的ascii码从小到大排序
sorted(...)
sorted(iterable, cmp=None, key=None, reverse=False) --> new sorted list
iterable:是可迭代类型;
cmp:是带两个参数的比较函数,比较内容由另一个参数key决定,返回值: 负数: e1 < e2, 0: e1 == e2, 正数: e1 > e2. 默认为 None, 即内建的比较函数.
key:是带一个参数的函数, 用来为每个元素提取比较值. 默认为 None, 即直接比较每个元素.
reverse:排序规则. reverse = True 或者 reverse = False,有默认值。
返回值:是一个排序的可迭代类型,与iterable一样。
通常, key 和 reverse 比 cmp 快很多, 因为对每个元素它们只处理一次; 而 cmp 会处理多次
对由字典排序
- >>> d = {'data1':3,'data2':1,'data3':2,'data4':4}
- >>> sorted(d.iteritems(), key=itemgetter(1), reverse=True)
- [('data4', 4), ('data1',3), ('data3',2),
('data2',1)]
引自:http://www.cnblogs.com/linyawen/archive/2012/03/15/2398292.html
Python的内置dictionary数据类型是无序的,通过key来获取对应的value。可是有时我们需要对dictionary中 的item进行排序输出,可能根据key,也可能根据value来排。
list的排序,使用如下
使用cmp:
>>>L = [('b',2),('a',1),('c',3),('d',4)]
>>>print sorted(L, cmp=lambda x,y:cmp(x[1],y[1]))
[('a', 1), ('b', 2), ('c', 3), ('d', 4)]
使用keys:
>>>L = [('b',2),('a',1),('c',3),('d',4)]
>>>print sorted(L, key=lambda x:x[1]))
[('a', 1), ('b', 2), ('c', 3), ('d', 4)]
reverse是决定正序还是倒序的:
>>> print sorted([5, 2, 3, 1, 4], reverse=True)
[5, 4, 3, 2, 1]
>>> print sorted([5, 2, 3, 1, 4], reverse=False)
[1, 2, 3, 4, 5] 注:效率key>cmp(key比cmp快) 在Sorting Keys中:我们看到,此时排序过的L是仅仅按照第二个关键字来排的,如果我们想用第二个关键字
排过序后再用第一个关键字进行排序呢?
>>> L = [('d',2),('a',4),('b',3),('c',2)]
>>> print sorted(L, key=lambda x:(x[1],x[0]))
>>>[('c', 2), ('d', 2), ('b', 3), ('a', 4)]
用 operator 函数来加快速度, 上面排序等价于:(itemgetter的用法见 注释2)
- >>> from operator
import itemgetter, attrgetter - >>> sorted(students, key=itemgetter(2))
>>> from operator import itemgetter, attrgetter
>>> sorted(students, key=itemgetter(2))
用 operator 函数进行多级排序
- >>> sorted(students, key=itemgetter(1,2))# sort by grade then by age
- [('john', 'A',15), ('dave','B',10),
('jane','B',12)]
>>> sorted(students, key=itemgetter(1,2)) # sort by grade then by age
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
python的sorted的更多相关文章
- Python: sort,sorted,OrderedDict的用法
Python: sort,sorted,OrderedDict的用法 from http://stqdd.com/archives/427 by 莫亚菜 python对容器内数据的排序有两种,一种是容 ...
- Python中sorted()方法
Python中sorted()方法的用法 1.先说一下iterable,中文意思是迭代器. Python的帮助文档中对iterable的解释是:iteralbe指的是能够一次返回它的一个成员的对象.i ...
- python基础——sorted()函数
python基础——sorted()函数 排序算法 排序也是在程序中经常用到的算法.无论使用冒泡排序还是快速排序,排序的核心是比较两个元素的大小.如果是数字,我们可以直接比较,但如果是字符串或者两个d ...
- 【Python】 sorted函数
我们需要对List.Dict进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序,在本地进行排序,不返回副本方法2.用built-in函数so ...
- python中sorted()和set()去重,排序
前言 在看一个聊天机器人的神经网络模型训练前准备训练数据,需要对训练材料做处理(转化成张量)需要先提炼词干,然后对词干做去重和排序 words = sorted(list(set(words))) 对 ...
- [转].Python中sorted函数的用法
[Python] sorted函数 我们需要对List.Dict进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序,在本地进行排序,不返回副 ...
- Python中sorted()方法的用法
Python中sorted()方法的用法 2012-12-24 22:01:14| 分类: Python |字号 订阅 1.先说一下iterable,中文意思是迭代器. Python的帮助文档中对i ...
- Python中sorted函数的用法(转)
[Python] sorted函数 我们需要对List.Dict进行排序,Python提供了两个方法 对给定的List L进行排序, 方法1.用List的成员函数sort进行排序,在本地进行排序,不返 ...
- Python中sorted(iterable, /, *, key=None, reverse=False)的参数中的斜杆是什么意思?
通过help(sorted)查看sorted的帮助文档,显示如下: Help on built-in function sorted in module builtins: sorted(iterab ...
- python 中 sorted() 和 list.sort() 的用法
今天用python自带的sorted对一个列表进行排序, 在这里总结一下 只要是可迭代对象都可以用sorted . sorted(itrearble, cmp=None, key=None, reve ...
随机推荐
- south 命令学习
south 命令学习 概述 在django某个版本之前,django自身提供一个创建数据库的命令-syncdb,它会根据model来创建相应的表,但是这个命令不好的地方在于,如果想要对model进行更 ...
- R语言do.call 函数用法详解
虽然R语言有类型很丰富的数据结构,但是很多时候数据结构比较复杂,那么基本就会用到list这种结构的数据类型.但是list对象很难以文本的形式导出,因此需要一个函数能快速将复杂的list结构扁平化成da ...
- Python3 标准库概览
操作系统接口 os模块提供了不少与操作系统相关联的函数. >>> import os >>> os.getcwd() # 返回当前的工作目录 'C:\\Python ...
- 解放双手——Android的自动化构建及发布
在一个App从开发到测试的过程中,我有很长一段时间都是这样做的:打包,上传到tower,在tower上编写本次更新说明,通知测试.一般情况下,打包及上传的过程大概也就2分钟.除此之外,由于项目代码有作 ...
- JVM初探- 使用堆外内存减少Full GC
JVM初探-使用堆外内存减少Full GC 标签 : JVM 问题: 大部分主流互联网企业线上Server JVM选用了CMS收集器(如Taobao.LinkedIn.Vdian), 虽然CMS可与用 ...
- 给定 n×n 的实数矩阵,每行和每列都是递增的,求这 n^2 个数的中位数。
#define COL 4 #define ROW 4 int findMedian(int matrix[][COL], int row, int col) { int* arr = new int ...
- Errors occurred during the build. Errors running builder 'JavaScript Validator' on project '项目名'.
把JavaScript Validator去掉.去掉的方法是:选择一个项目--右键Properties--Builders(排第二)--点一下右侧会有四项--取消第一项"JavaScript ...
- SOAP Binding: Difference between Document and RPC Style Web Services
SOAP Binding: Difference between Document and RPC Style Web Services 20FLARES Twitter 1Facebook 9Goo ...
- 20160214.CCPP体系详解(0024天)
程序片段(01):CGI.c 内容概要:CGI-cloud #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> int main01(vo ...
- 给pdf文件添加防伪水印logo(附工程源码下载)
pdf添加水印logo这种需求场景确实很少,有些时候一些销售单据生成pdf添加一个水印logo,做一个简单的防伪效果,虽然实际上并没有太大作用,但是产品经理说要,巴拉巴拉--省略一万字. 下面将源码分 ...