Python实现嵌套列表去重方法示例
Python  /  管理员 发布于 7年前   213
发现问题
python嵌套列表大家应该都不陌生,但最近遇到了一个问题,这是工作中遇到的一个坑,首先看一下问题
raw_list = [["百度", "CPY"], ["京东", "CPY"], ["黄轩", "PN"], ["百度", "CPY"]]
列表嵌套了列表,并且有一个重复列表["百度", "CPY"],现在要求将这个重复元素进行去重(重复是指嵌套的列表内两个元素都相同),并且保证元素顺序不变,输出还是嵌套列表,即最后结果应该长这样:[["百度", "CPY"], ["京东", "CPY"], ["黄轩", "PN"]]
正常Python去重都是使用set,所以我这边也是用这种思想处理一下
In [8]: new_list = [list(t) for t in set(tuple(_) for _ in raw_list)]In [9]: new_listOut[9]: [['京东', 'CPY'], ['百度', 'CPY'], ['黄轩', 'PN']]
=。=以为大功告成,结果发现嵌套列表顺序变了
好吧一步步找一下是从哪边顺序变了的
In [10]: s = set(tuple(_) for _ in raw_list)In [11]: sOut[11]: {('京东', 'CPY'), ('百度', 'CPY'), ('黄轩', 'PN')}
恍然大悟关于set的两个关键词:无序 和 不重复 =。=
所以从set解决排序问题基本无望了,然而我还没有放弃,现在问题就变成了对于new_list怎么按照raw_list元素顺序排序,当然肯定要通过sort实现
翻一下Python文档找到以下一段话
文档地址
sort(*, key=None, reverse=False)This method sorts the list in place, using only < comparisons between items. Exceptions are not suppressed - if any comparison operations fail, the entire sort operation will fail (and the list will likely be left in a partially modified state). [`sort()`](https://docs.python.org/3/library/stdtypes.html?highlight=sort#list.sort "list.sort") accepts two arguments that can only be passed by keyword ( [keyword-only arguments](https://docs.python.org/3/glossary.html#keyword-only-parameter) ):key specifies a function of one argument that is used to extract a comparison key from each list element (for example, key=str.lower). The key corresponding to each item in the list is calculated once and then used for the entire sorting process. The default value of None means that list items are sorted directly without calculating a separate key value.
开始划重点:
sort方法通过参数key指定一个方法,换句话说,key参数的值是函数。
这个函数和new_list上的每个元素会产生一个结果,sort通过这个结果进行排序。
于是这里就想到求出new_list里的每一个元素在raw_list里的索引,根据这个索引进行排序。
代码实现如下:
In [13]: new_list.sort(key=raw_list.index)In [14]: new_listOut[14]: [['百度', 'CPY'], ['京东', 'CPY'], ['黄轩', 'PN']]
结果和期望一样 =。=
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家的支持。
122 在
学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
Copyright·© 2019 侯体宗版权所有·
粤ICP备20027696号