CSV无可厚非的是一种良好的通用文件存储方式,几乎任何一款工具或者编程语言都能对其进行读写,但是当文件特别大的时候,CSV这种存储方式就会变得十分缓慢且低效.本文将介绍几种在Python中能够代替CSV这种格式的其他文件格式,并对比每种文件存储的时间与大小. 先说结论,parquet是最好的文件存储格式,具体对比见下文. 生成随机数据 导入依赖 import random import string import pickle # 以下需要自行安装 import numpy as np impo…
要求将Excel数据,大批量的导入到数据库中,尽量少的访问数据库,高性能的对数据库进行存储. 一个比较好的解决方案,就是采用SqlBulkCopy来处理存储数据. SqlBulkCopy存储大批量的数据非常的高效,就像这个方法的名字一样,可以将内存中的数据表直接的一次性的存储到数据库中,而不需要一次一次的向数据库Insert数据. 初次实验,百万级别的数据表,也只需几秒时间内就可以完全的存入数据库中,其速度,比传统的Insert方法不止快很多倍.下面,我将用代码,介绍其用法. #region S…
  代码审查者在审查代码时有非常多的东西需要关注.一个团队需要明确对于自己的项目哪些点是重要的,并不断在审查中就这些点进行检查. 人工审查代码是十分昂贵的,因此尽可能地使用自动化方式进行审查,如:代码格式.代码样式.检查常见bug.确定常见安全问题以及运行自动化测试. 当针对性能进行审查时,了解系统的性能需求是明确潜在问题的关键. 一些简单的人工检查可以显著提升应用的安全性. 代码审查是应该在互相沟通中进行讨论的,而不是相互对抗.预先确定哪些是要点哪些不是,可以减少冲突并拟定预期. 众所周知,在…
前言 在写Android应用时候,有时候或多或少的需要运用广播来解决某些需求,我们知道广播有一个特性,就是使用sendBroadcast(intent);发送广播时,手机内所有注册了BroadcastReceiver的应用都可以在接收到这个广播的,并在BroadcastReceiver的onReceive()方法进行匹配,而应用是否使用这个广播则是取决与我们定义的Action与广播接收者的是否匹配,也就是说平常我们使用的广播是全局的广播,谁都有权收到.所以这就有可能产生安全漏洞和隐私数据泄密:…
在做Android 开发过程中,会遇到一些小的问题.尽管自己动手也能解决.可是有了一些小工具,解决这些问题就得心应手了,今天就为大家推荐一下Android 开发遇到的小工具,来让你的开发更高效. Vysor Vysor 是一个能够将手机的屏幕投影到电脑上.当然也能够操作,当我们做分享或者演示的时候.这个工具起到了作用. Vector Asset Android Studio 在1.4 支持了VectorAsset.所谓VectorAsset:它能够帮助你在Android 项目中加入Materia…
目录 Pull Request 工作流--更高效的管理代码 1.问题 2.解决方案 3.Git分支流管理代码具体实施 3.1本地分支操作管理 3.1.1查看分支 3.1.2创建分支 3.1.3切换分支 3.1.4删除分支 3.1.5将本地分支上传到远程服务器 3.1.6合并分支 3.2远程分支操作管理 3.2.1 选择分支管理 3.2.2 新建合并请求 3.2.3输入标题描述 3.2.4审核合并请求 3.2.5审核代码 3.2.6审核者同意合并分支 3.2.7 合并完成 Pull Request…
我记得我是写过一篇关于倾斜单体化的简书文章的,但是现在找不到了.不过找不到也好,就让他随风逝去吧,因为当时我写那篇文章的时候,就发现了cesium实际是有另一种更高效的单体化.就下面这个示例 https://cesiumjs.org/Cesium/Build/Apps/Sandcastle/index.html?src=3D%20Tiles%20Photogrammetry%20Classification.html   sandcastle中分类3dtiles 我们来看看他的代码:   示例代…
[源码解析]为什么mapPartition比map更高效 目录 [源码解析]为什么mapPartition比map更高效 0x00 摘要 0x01 map vs mapPartition 1.1 map 1.2 mapPartition 1.3 异同 0x02 代码 0x03 Flink的传输机制 3.1 传输机制概述 3.2 远程通信 3.3 TaskManager进程内传输 3.4 源码分析 0x04 runtime 4.1 Driver 4.2 MapDriver 4.3 MapParti…
有情怀,有干货,微信搜索[三太子敖丙]关注这个不一样的程序员. 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点.资料以及我的系列文章. 前言 数据库系列更新到现在我想大家对所有的概念都已有个大概认识了,这周我在看评论的时候我发现有个网友的提问我觉得很有意思:帅丙如何设计一个索引?你们都是怎么设计索引的?怎么设计更高效? 我一想索引我写过很多了呀,没道理读者还不会啊,但是我一回头看完,那确实,我就写了索引的概念,优劣势,没提到怎么设计…
想要更高效地找到信息,你需要掌握这些搜索技巧 (google or baidu) 转载:https://tingtalk.me/search-tips/ 在大型局域网(互联网)的今天,你以为搜索是一门技术,其实搜索是一门忍术.你必须忍受不同平台各自为阵,内容信息就像孤岛,也必须忍受搜索结果被活埋在广告堆中--以至于,目前来说,好的搜索方式,不止是掌握了搜索方法,还要,找对平台.by Topbook 有人说,搜索引擎是 PC 互联网的完美商业模式,这个论断被 Google 和百度证明.可是移动互联…