Data.ByteString

String 是 [Char] 的同义词,在使用上存在List的惰性所带来的性能问题。

在处理大型二进制文件时,可以使用 ByteString 来代替 String。

ByteString 类型分为以下两种:

  • Lazy 模块 Data.ByteString.Lazy 中的 Data.ByteString.Lazy.ByteString

    Lazy 模块内部使用 chunks(64K数据块)。
  • Strict 模块 Data.ByteString 中的 Data.ByteString.ByteString
Prelude> import qualified Data.ByteString.Lazy as B
Prelude B> import qualified Data.ByteString as S
Prelude B S> B.pack [99,97,110]
"can"
Prelude B S> B.fromChunks [S.pack [40,41,42], S.pack [43,44,45], S.pack [46,47,48]]
"()*+,-./0"
Prelude B S> B.cons 85 $ B.pack [80,81,82,84]
"UPQRT"
Prelude B S> foldr B.cons' B.empty [50..60]
"23456789:;<"

Data.Text

在处理大型文本文件时,可以使用 Text 来代替 String。

Text 是一个 Unicode 友好的字符串类型。

Text 类型分为以下两种:

  • Lazy 模块 Data.Text.Lazy 中的 Data.Text.Lazy.Text

    Lazy 模块内部使用 chunks。
  • Strict 模块 Data.Text 中的 Data.Text.Text
Prelude> import qualified Data.Text.Lazy as T
Prelude T> :t T.pack "abc"
T.pack "abc" :: T.Text
Prelude T> T.replace (T.pack "a") (T.pack "b") (T.pack "aXaXaX")
"bXbXbX"
Prelude T> T.splitOn (T.pack "a") (T.pack "aXaXaX")
["","X","X","X"]
  • pack :: String -> Text

    pack 函数将 String 转换成 Text。

Data.Text.Encoding

Encoding 模块用于 ByteString 和 Text 之间类型转换。

Text 包含 Lazy 模块 Data.Text.Encoding.Lazy 和 Strict 模块 Data.Text.Encoding。

其中 Lazy 模块提供 Data.ByteString.Lazy.ByteString 和 Data.Text.Lazy.Text 之间的类型转换功能。

而 Strict 模块则提供 Data.ByteString.ByteString 和 Data.Text.Text 之间的类型转换功能。

Data.String.Conversions

$ cabal install string-conversions
Installed string-conversions-0.4.0.1
Prelude> :m +Data.String.Conversions
Prelude Data.String.Conversions>

Conversions 模块提供以下五种类型之间的类型转换功能。

  • String
  • Data.ByteString.ByteString

    缩写为 StrictByteString 或 SBS
  • Data.ByteString.Lazy.ByteString

    缩写为 LazyByteString 或 LBS
  • Data.Text.Text

    缩写为 StrictText 或 ST
  • Data.Text.Lazy.Text

    缩写为 LazyText 或 LT
Prelude Data.String.Conversions> cs "abc" :: ST
"abc"
  • ConvertibleStrings

    ConvertibleStrings 是个类型类,五种字符串类型都被定义成了 ConvertibleStrings 类型类的实例。
  • cs :: ConvertibleStrings a b => a -> b

    cs 函数根据输入输出类型自动实施五种字符串类型之间的类型转换功能。

OverloadedStrings

GHC 提供了语言扩展 OverloadedStrings。

  • 不使用这个语言扩展,所有的字符串字面量都属于 String 也就是 [Char] 类型。
  • 如果使用这个语言扩展,那么所有的字符串字面量就都属于 IsString a => a 类型。
  • String, ByteString, Text 都是 IsString 类的实例。
Module Data.String
class IsString a where
fromString :: String -> a
{-# LANGUAGE OverloadedStrings #-}
import qualified Data.Text.IO as T a :: Text
a = "Hello World" b :: ByteString
b = "Hello World" c :: String
c = "Hello World" main = do putStrLn "Hello as String!"
T.putStrLn "Hello as Text!"

Text 是 Monoid

Prelude Data.Text> ("abc" :: Text) <> ("def" :: Text)
"abcdef"

Haskell语言学习笔记(49)ByteString Text的更多相关文章

  1. Haskell语言学习笔记(88)语言扩展(1)

    ExistentialQuantification {-# LANGUAGE ExistentialQuantification #-} 存在类型专用的语言扩展 Haskell语言学习笔记(73)Ex ...

  2. Haskell语言学习笔记(79)lambda演算

    lambda演算 根据维基百科,lambda演算(英语:lambda calculus,λ-calculus)是一套从数学逻辑中发展,以变量绑定和替换的规则,来研究函数如何抽象化定义.函数如何被应用以 ...

  3. Haskell语言学习笔记(69)Yesod

    Yesod Yesod 是一个使用 Haskell 语言的 Web 框架. 安装 Yesod 首先更新 Haskell Platform 到最新版 (Yesod 依赖的库非常多,版本不一致的话很容易安 ...

  4. Haskell语言学习笔记(20)IORef, STRef

    IORef 一个在IO monad中使用变量的类型. 函数 参数 功能 newIORef 值 新建带初值的引用 readIORef 引用 读取引用的值 writeIORef 引用和值 设置引用的值 m ...

  5. Haskell语言学习笔记(39)Category

    Category class Category cat where id :: cat a a (.) :: cat b c -> cat a b -> cat a c instance ...

  6. Haskell语言学习笔记(93)Data.Text

    Data.Text.Read Prelude> :set -XOverloadedStrings Prelude> :m +Data.Text.Read Prelude Data.Text ...

  7. Haskell语言学习笔记(92)HXT

    HXT The Haskell XML Toolbox (hxt) 是一个解析 XML 的库. $ cabal install hxt Installed hxt-9.3.1.16 Prelude&g ...

  8. Haskell语言学习笔记(89)Unicode UTF8

    unicode-show $ cabal install unicode-show Installed unicode-show-0.1.0.2 Prelude> :m +Text.Show.U ...

  9. Haskell语言学习笔记(86)字符串格式化与插值

    String 的格式化 Text.Printf 这个模块用来处理字符串格式化. printf :: PrintfType r => String -> r printf 用于格式化字符串, ...

随机推荐

  1. centos 修改host

    centos 修改host vi /etc/hosts添加一行127.0.0.1 test.com /etc/rc.d/init.d/network restart

  2. C#获取本机IP地址(ipv4)

    获取本机所有IP地址: 这些地址是包含所有网卡(虚拟网卡)的ipv4和ipv6地址. string name = Dns.GetHostName(); IPAddress[] ipadrlist = ...

  3. win xp firefox,chrome 在浏览网页时字体发虚,可以设置为新宋体

    firefox,chrome 在浏览网页时字体发虚,比如:驱动之家.可以设置为新宋体.

  4. js 正则用空格分割字符串

    var filename = "ASDFK*SADF+ALDLAS-LDKFADFa*seAc tion.java";var arr = filename.split(/\*|\- ...

  5. 关于office2016桌面新建不显示execl问题

    在百度,google找了很多方法都没有文档可以解决此问题,office2016安装完在新建是由ececl的,应该是我用了清理注册表工具,对execl项进行清理,造成没有execl,所以贴出原版xls, ...

  6. bzoj4153 [Ipsc2015]Familiar Couples

    Description 有n对夫妇,一开始夫妇之间互不认识,若两男或两女成为朋友,称他们为"熟人","熟人"关系具有传递性,即若a熟b且b熟c则a熟c.若两组夫 ...

  7. 软件-分布式:Kylin (apache开源分布式分析引擎软件)

    ylbtech-软件-分布式:Kylin (apache开源分布式分析引擎软件) Apache Kylin™是一个开源的分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力以 ...

  8. 杂项-frame:Rails框架

    ylbtech-杂项-frame:Rails框架 Rails框架首次提出是在2004年7月,它的研发者是26岁的丹麦人David Heinemeier Hansson.不同于已有复杂的Web 开发框架 ...

  9. php array_flip() 删除数组重复元素——大彻大悟

    1. php array_flip() 删除数组重复元素,如果用于一维索引数组,好理解. [root@BG-DB:~]$more arr.php  <?php         $arr = ar ...

  10. numpy的linspace函数

    numpy.linspace(start, stop, num=50, endpoint=True, retstep=False,dtype=None)[source] 文档:https://docs ...