目录

前言

随着行业的发展,编程能力逐渐成为软件测试从业人员的一项基本能力。因此在笔试和面试中常常会有一定量的编码题,主要考察以下几点。

  • 基本编码能力及思维逻辑
  • 基本数据结构(顺序表、链表、队列、栈、二叉树)
  • 基本算法(排序、查找、递归)及时间复杂度

除基本算法之外,笔试面试中经常会考察以下三种思想:

  • 哈希
  • 递归
  • 分治

哈希

哈希即Python中的映射类型,字典和集合,键值唯一,查找效率高,序列(列表、元祖、字符串)的元素查找时间复杂度是O(n),而字典和集合的查找只需要O(1)。

因此哈希在列表问题中主要有两种作用:

  1. 去重
  2. 优化查找效率

列表去重

列表去重在不考虑顺序的情况下可以直接使用set()转换(转换后会自动排序),需要保持顺序可以使用字典构建的fromkeys()方法,利用字典键值的唯一性去重。

不考虑顺序:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
result = list(set(l))
print(result)

运行结果:

[1, 2, 3, 4, 5, 6]

考虑顺序:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
s = set()
result = []
for i in l:
if i in s:
continue
s.add(i)
result.append(i)
print(result)

注意,这里如果使用:

if not i in result:
result.append(i)

虽然看起来代码简单,但是列表in查找的的时间复杂度为O(n),not in的效率比in要差,每次都要进行n次比对。

上例中,使用了一个集合变量s来优化in查找,同时使用in代替not in。

Python3.6后字典按键值插入顺序,如果使用Python3.6,也可以利用字典的有序性来去重,示例如下:

l = [2,1,2,3,4,5,6,6,5,4,3,2,1]
result = list({}.fromkeys(l).keys())
print(result)

运行结果:

[2, 1, 3, 4, 5, 6]

列表分组

一串字母数字组合的字符串,找出相同的字母或数字,并按照个数排序。

l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1]
set1 = set(l)
result = [(item, l.count(item)) for item in set1]
result.sort(key=lambda x:x[1], reverse=True)
print(result)

这里使用哈希的键值不重复性。当然也可以使用python自带的groupby函数,代码如下:

from itertools import groupby

l = [1,2,3,'a','b','c',1,2,'a','b',3,'c','d','a','b',1]
l.sort(key=lambda x: str(x)) # 分组前需要先排序
result = []
for item, group in groupby(l, key=lambda x: str(x)):
result.append((item, len(list(group))))
result.sort(key=lambda x:x[1], reverse=True)
print(result)

海量数据top K

对于小数据量可以使用排序+切片,而对于海量数据,需要考虑服务器硬件条件。即要考虑时间效率,也要考虑内存占用,同时还要考虑数据特征。如果大量的重复数据,可以先用哈希进行去重来降低数据量。

这里我们使用生成器生成1000万个随机整数,求最大的1000个数,生成随机数的代码如下:

import random
import time
n = 10000 * 1000
k = 1000
print(n)
def gen_num(n):
for i in range(n):
yield random.randint(0, n)
l = gen_num(n)
  • 不限内存可以直接使用set()去重+排序
start = time.time()
l = list(set(l))
result = l[-k:]
result.reverse()
print(time.time()-start)

1000w个数据会全部读入内存,set后列表自动为递增顺序,使用切片取-1000到最后的即为top 1000的数

  • 使用堆排可以节省一些内存
start = time.time()
result = heapq.nlargest(k, l)
print(time.time()-start)

这里是用来Python自带的堆排库heapq。使用nlargest(k,l)可以取到l序列,最大的k个数。

  • 较小内存可以分治策略,使用多线程对数据进行分组处理(略)

两数之和

l=[1,2,3,4,5,6,7,8] 数据不重复,target=6,快速找出数组中两个元素之和等于target 的数组下标。

注意,不要使用双重循环,暴力加和来和target对比,正确的做法是单层循环,然后查找target与当前值的差,是否存在于列表中。

但是由于列表的in查询时间复杂度是O(n),即隐含了一层循环,这样效率其实和双重循环是一样的,都是O(n^2)。

这里就可以使用哈希来优化查询差值是否在列表中操作,将O(n)降为O(1),因此总体的效率就会变成O(n^2)->O(n)。

l = [1,2,3,4,5,6,7,8]
set1 = set(list1) # 使用集合已方便查找
target = 6 result = []
for a in set1:
b = target - a
if a < b < target and b in set1: # 在集合中查找,为避免重复,判断a为较小的那个值
result.append((list1.index(a), list1.index(b))) # 列表index取下标的操作为O(1)
print(result)

递归问题

递归是一种循环调用自身的函数。可以用于解决以下高频问题:

  • 阶乘
  • 斐波那切数列
  • 跳台阶、变态跳台阶
  • 快速排序
  • 二分查找
  • 二叉树深度遍历(前序、中序、后序)
  • 求二叉树深度
  • 平衡二叉树判断
  • 判断两颗树是否相同

递归是一种分层推导解决问题的方法,是一种非常重要的解决问题的思想。递归可快速将问题层级化,简单化,只需要考虑出口和每层的推导即可。

如阶乘,要想求n!,只需要知道前一个数的阶乘(n-1)!,然后乘以n即可,因此问题可以转为求上一个数的阶乘,依次向前,直到第一个数。

举个通俗的例子:

A欠你10万,但是他没那么多钱,B欠A 8万,C欠B 7万 C现在有钱。因此你要逐层找到C,一层一层还钱,最后你才能拿到属于你的10万。

编写递归函数有两个要点:

  1. 出口条件,可以不止一个
  2. 推导方法(已知上一个结果怎么推导当前结果)

阶乘

求n的阶乘

  • 出口:n = 1 时,返回1
  • 推导:(n-1)层的结果 * n

代码如下:

def factorial(n):
if n == 1: # 出口
return 1
return factorial(n-1) * n # 自我调用求上一个结果,然后推导本层结果

也可以简写为 factorial = lambda n: 1 if n==1 else factorial(n-1) * n

斐波那切数列

斐波那切数列是 1 1 2 3 5 8 ...这样的序列。前两个数为1,后面的数为前两个数之和。

  • 出口:n <= 2,返回1
  • 推导:(n-1)层的结果 + (n-2)层的结果

代码如下:

def fib(n):
if n<=2:
return 1
return fib(n-2) + fib(n-1)

递归是一种分层简化问题的解法,但不一定是效率最高的解法,比如斐波那切数列中,在求fib(n-2) 和 fib(n-1)时实际上反复求解了两次fib(n-2)。

可以通过缓存来优化效率,代码如下。

from functools import lru_cache

@lru_cache()
def fib(n):
if n<=2:
return 1
return fib(n-2) + fib(n-1)

跳台阶、变态跳台阶

  • 跳台阶:一只青蛙,一次可以跳上1阶,也可以跳上2阶,问跳上n阶有多少种跳法。
  • 变态跳台阶:一只青蛙,一次可以跳上1阶,可以一次跳上n阶,为跳上n阶有多少种跳法。

这个问题关键是逻辑分析每层的推导过程。

跳台阶实际上就是一个从第二位开始的斐波那切数列:1 2 3 5 8 13 ...

  • 出口:n <= 2,返回n(即1时返回1,2时返回2)
  • 推导:(n-1)层的结果 + (n-2)层的结果

代码如下:

jump1 = lambda n: n if n<=2 else jump1(n-2) + jump1(n-1)

变态跳台阶只是推导方式不同,每一层的结果是上一层跳法的2倍。

  • 出口:n <= 2,返回n
  • 推导:(n-1)层的结果 * 2

代码如下:

jump2 = lambda n: n if n<=2 else jump2(n-1)  * 2

快速排序

快速排序的是想是选一个基准数(如第一个数),将大于该数和小于该数的分成两块,然后在每一块中重复执行此操作,直到该块中只有一个数,即为有序。

  • 出口:列表长度为1(<2)时,返回列表
  • 选择一个数,(将小于该数的序列)排序结果 + 基准数 + (大于该数的序列)排序结果
def quick_sort(l):
if len(l) < 2:
return l
target = l[0] # 以第一个数为基准数
low_part, eq_part, high_part = [], [target], []
for i in l[1:]:
if i < target:
low_part.append(i)
elif i == target:
eq_part.append(i)
else:
high_part.append(i)
return quick_sort(low_part) + eq_part + quick_sort(high_part)

注:eq_part中应包含基准数target。

二分查找

二分查找需要序列首先有序。思想是先用序列中间数和目标值对比,如果目标值小,则从前半部分(小于中间数)重复此查找,否则从后半部分重复此查找。

  • 出口1:中间数和目标数相同,返回中间数下标
  • 出口2:列表为空,返回未找到
  • 推导:
def bin_search(l, n):
if not l:
return None
mid = len(l) // 2
if l[mid] == n:
return mid
if l[mid] > n:
return bin_search(l[:mid])
return bin_search(l[mid+1:])

二叉树遍历

二叉树是非常常考的一种数据结构。其基本结构就是一个包含数据和左右节点的一种结构,使用Python类描述如下:

class Node(object):
def __init__(self, data, left=None, right=None):
self.data = data
self.left = left
self.right = right

二叉树的遍历分为分层遍历(广度优先)和深度遍历(深度优先)两种,其中深度遍历又分为前序、中序、后序三种。

分层遍历由于每次处理多个节点,使用循环解决更加方便一点(也可以是使用递归解决)。

分层遍历代码如下:

def lookup(root):
row = [root]
while(row):
print(row)
row = [kid for item in row for kid in (item.left, item.right) if kid]

深度遍历

  • 出口:节点为None
  • 推导:
    • 前序:打印当前节点-》遍历左子树 -》遍历右子树
    • 中序:遍历左子树 -》打印当前节点-》遍历右子树
    • 后序:遍历左子树 -》遍历右子树-》打印当前节点

以前序为例:

def deep(root):
if root is none:
return
[print(root.data), deep(root.left), deep(root.right)]

二叉树最大深度

二叉树最大深度即其左子树深度和右子树深度中最大的一个加上1(当前节点)。由于二叉树的每一个左右节点都是一个二叉树,这种层层嵌套的结构非常适合使用递归求解。

  • 出口:节点为空,深度返回0
  • 推导:左子树深度和右子树深度中最大的一个 + 1
def max_depth(root):
if not root:
return 0
return max([max_depth(root.left), max_depth(root.right)]) + 1

相等二叉树判断

相等二叉树是只,一个二叉树,节点数据相同,左右子树也完全相同。由于左右子树也是一个二叉树,因此也可以使用递归求解。

  • 出口:最后的节点都为None时,两个相等,返回True
  • 推导:判断两个节点数据是否相等,左子树是否相等(递归),右子树是否相等(递归)
def is_same_tree(p, q):
if p is None and q is None:
return True
elif p and q:
return p.data == q.data and is_same_tree(p.left, q.left) and is_same_tree(p.right, q.right)

平衡二叉树判断

平衡二叉树是指,一个二叉树的左右子树的高度差不超过1。平衡二叉树的左右子树也应该是平衡二叉树,因此这也是一个递归问题。

  • 出口:两个节点都为None时,返回True(平衡)
  • 判断左子树和右子树深度的差<=1,并且左右子树都是平衡二叉树(递归)

注:这里需要使用以上求二叉树深度的方法

def max_depth(root):
if not root:
return 0
return max([max_depth(root.left), max_depth(root.right)]) + 1 def is_balance_tree(root):
if root is None:
return True
return abs(max_depth(root.left)-max_depth(root.right))<=1 and is_balance_tree(root.left) and is_balance_tree(root.right)

其他

字符串统计

str1 = 'abcdaacddceea'
set1 = set(str1)
result = [(char, str1.count(char)) for char in set1]
print(result)

统计重复最多的n个字符

from collections import Counter
c = Counter('abcdaacddceea')
print(c.items())
print(c.most_common(3))

字符串反转

  • 简单字符串反转

    Python中字符串反转方式非常多,而且比较高效,可以使用反向切片或者reverse实现。
'abcefg'[::-1]

''.join(reversed('abcdefg'))
  • 包含数字字母的字符串,仅反转字母

    可以通过遍历判断,如果是字母则取其对应反转索引位置的字母,如果是数字则取当前数字。
a = 'abc123efg'
l = len(a)
r = []
for i,c in enumerate(a):
r.append(c) if c.isdigit() else r.append(a[l-i-1])
print(''.join(r))

判断括号是否闭合

这是栈使用的一个经典示例,思路为,遇到正括号则入栈,遇到反括号则和栈顶判断,如果匹配则匹配的正括号出栈(完成一对匹配),否则打印不匹配,break退出。

text = "({[({{abc}})][{1}]})2([]){({[]})}[]"

def is_closed(text)
stack = [] # 使用list模拟栈, stack.append()入栈, stack.pop()出栈并获取栈顶元素
brackets = {')':'(',']':'[','}':'{'} # 使用字典存储括号的对应关系, 使用反括号作key方便查询对应的括号
for char in text:
if char in brackets.values(): # 如果是正括号,入栈
stack.append(char)
elif char in brackets.keys(): # 如果是反括号
if brackets[char] != stack.pop(): # 如果不匹配弹出的栈顶元素
return False
return True print(is_closed(text))

合并两个有序列表,并保持有序

常见的解法有两种:

  • 连接 + 排序,时间复杂度度为O((m+n)log2(m+n))
  • 两个队列根据大小依次弹出,时间复杂度度约为O(m+n)

依次出队列的逻辑为:

  • 队列1为空,队列2不为空,从队列2弹出一个数据
  • 队列2为空,队列1不为空,从队列1弹出一个数据
  • 两个都不为空,判断两个对队列顶端哪个小,从哪个列表弹出一个数据

以下为使用Python列表模拟两个队列依次弹出的示例。

由于Python列表尾部弹出list.pop()的的操作效率O(1),比首部弹出list.pop(0)的操作效率O(n)更高,因此我们先按从大到小排序,最后在执行一次反转。

list1 = [1,5,7,9]
list2 = [2,3,4,5, 6,8,10,12,14]
result = []
for i in range(len(list1) + len(list2)):
if list1 and not list2:
result.append(list1.pop())
elif list2 and not list1:
result.append(list2.pop())
else:
result.append(list1.pop()) if list1[-1] > list2[-1] else result.append(list2.pop()) # 弹出顶端大的数
result.reverse() # 执行反转
print(result)

两个队列实现一个栈

队列是先入先出,栈是先入后出。

使用两个队列实现栈的方式有很多种,主要分为优化入栈和优化出栈两种,以下为优化入栈的一种实现方法。

  • 入栈时直接存入队列q1
  • 出栈时,将q1中元素依次放入q2, 直到最后一个元素,弹出元素,然后将q2中元素重新依次放回q1

实现代码如下:

import queue

class Stack(object):
def __init__(self):
self.q1 = queue.Queue()
self.q2 = queue.Queue() def push(self, value):
self.q1.put(value) def pop(self):
while self.q1.qsize() > 1:
self.q2.put(self.q1.get())
value = self.q1.get()
while not self.q2.empty():
self.q1.put(self.q2.get())
return value

测试代码:

s = Stack()
[s.push(i) for i in [1,2,3,4,5,6,7]]
print(s.pop())
print(s.pop())
print(s.pop())
print(s.pop())

打印结果为:

7
6
5
4

Python自动化测试面试题-编程篇的更多相关文章

  1. Python自动化测试面试题-接口篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  2. Python自动化测试面试题-经验篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  3. Python自动化测试面试题-Linux篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  4. Python自动化测试面试题-MySQL篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  5. Python自动化测试面试题-Redis篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  6. Python自动化测试面试题-Selenium篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  7. Python自动化测试面试题-性能篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  8. Python自动化测试面试题-用例设计篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

  9. Python自动化测试面试题-Python基础篇

    目录 Python自动化测试面试题-经验篇 Python自动化测试面试题-用例设计篇 Python自动化测试面试题-Linux篇 Python自动化测试面试题-MySQL篇 Python自动化测试面试 ...

随机推荐

  1. Redis哨兵的配置和原理

    哨兵 在一个典型的一主多从的Redis系统中,当主数据库遇到异常中断服务后,需要手动选择一个从数据库升级为主数据库,整个过程需要人工介入,难以自动化. Redis2.8提供了哨兵2.0(2.6提供了1 ...

  2. 「模拟8.17」star way to heaven(并查集,最小生成树)

    80分打法 首先二分最后答案,答案即为r,可看作以每个k为圆心r为半径的圆 我们进行并查集维护,维护相交的圆的边界 最后判断是否存在圆将上下边界覆盖,如有证明不行 1 #include<iost ...

  3. 【题解】Luogu P2214 [USACO14MAR]哞哞哞Mooo Moo

    P2214 [USACO14MAR]哞哞哞Mooo Moo 题目描述 Farmer John has completely forgotten how many cows he owns! He is ...

  4. 基于websocket vue 聊天demo 解决方案

    基于websocket vue 聊天demo 解决方案 demo 背景 电商后台管理的客服 相关技术 vuex axios vue websocket 聊天几种模型 一对一模型 一对一 消息只一个客户 ...

  5. python随机漫步

  6. centos7 安装最新的 wiki confluence

    41.1 下载confluence Confluence是一个企业级的Wiki,可用于企业.部门.团队内部进行信息共享和协同编辑. 下载地址: https://www.atlassian.com/so ...

  7. 28、python3.7(windows)将ORACLE11gR2中的数据取出写入excel表

    28.1.下载python的离线扩展模块: 1.windows下python的离线扩展模块下载地址为: https://www.lfd.uci.edu/~gohlke/pythonlibs/ 提示: ...

  8. 13、linux中用户和用户组

    linux是多用户多进程的系统: 每个文件和进程都需要应对一个用户和用户组: linux系统通过uid和gid来识别用户和组的: 一个用户必须要有唯一的uid和一个主组来识别身份,不同的用户可以使用同 ...

  9. Series 1 java秒组合数

    Series 1 举几个例子发现,  系数中间对称,很容易想到组合数 c(n,m)==c[n,n-m).此题就是高精度求组合数,java秒之. time:1825ms   ,接近时限,如果n还稍微大一 ...

  10. CentOS-常用命令(版本:7.x)

    常用命令 注:centos命令不定期持续更新,希望能够帮到你~ 修改主机名 $ hostnamectl set-hostname xxx 查看IP $ vim /etc/sysconfig/netwo ...