《Go Cookbook CN》系列 08：数据处理——CSV文件读写与解析全攻略

约 3771 字大约 13 分钟

2026-04-02

本文聚焦Go语言中CSV文件的全维度处理能力，从CSV格式基础认知到实操层面的读写、解析、格式适配，手把手带你掌握Go标准库encoding/csv的核心用法。学完本文后，你将能独立完成CSV文件的读取（全量/逐行）、解析（反序列化到结构体、适配特殊格式）、写入（全量/逐行）等核心操作，解决实际开发中CSV处理的各类常见问题。

本篇核心收获

理解CSV格式的特性及Go标准库encoding/csv的适配规范
掌握Go读取CSV文件的两种核心方式（全量读取、逐行读取）及适用场景
学会将CSV数据反序列化到Go结构体，实现类型化数据处理
适配非标准CSV格式（自定义分隔符、忽略注释行、跳过标题行）的处理方法
掌握Go写入CSV文件的两种方式（全量写入、逐行写入）及缓冲区刷新等关键细节

8.0 CSV格式与Go处理能力概述

CSV（Comma-Separated Values，逗号分隔值）是通用的表格数据存储格式，可通过文本编辑器轻松读写，被Microsoft Excel、Apple Numbers等主流电子表格程序广泛支持，因此Go语言也通过标准库encoding/csv提供了完整的CSV生成与解析能力。

8.0.1 CSV格式的核心特性

无统一强制标准：虽有RFC 4180规范，但实际场景中并非所有CSV文件都用逗号分隔，制表符、分号等也常作为分隔符；
历史背景：CSV格式已有50余年历史，最早应用于IBM大型计算机的Fortran语言数据处理；
Go适配性：Go标准库encoding/csv默认遵循RFC 4180规范，同时支持自定义分隔符、注释忽略等扩展能力，适配非标准CSV文件。

模块小结：本模块明确了CSV格式的核心特性及Goencoding/csv库的基础定位，为后续实操奠定认知基础。

打开CSV文件：使用os.Open函数打开目标文件，返回os.File实例（实现io.Reader接口）；
创建CSV读取器：将文件实例传入csv.NewReader，生成csv.Reader实例；
全量读取数据：调用ReadAll方法，将所有数据读取到二维字符串数组[][]string中；
资源释放：通过defer file.Close()确保文件句柄正常释放。

8.1.3 完整代码示例

假设存在users.csv文件，内容如下：

id,first_name,last_name,email
1,Sausheong,Chang,<sausheong@email.com>
2,John,Doe,<john@email.com>

读取代码：

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    file, err := os.Open("users.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    rows, err := reader.ReadAll()
    if err != nil {
        log.Println("Cannot read CSV file:", err)
    }
    // rows为二维字符串数组，存储CSV所有行数据
}

8.1.4 关键注意事项

ReadAll返回的所有数据均为字符串类型，即使CSV中是整数、布尔值等，也需手动进行类型转换；
该方式会将整个文件加载到内存，大文件场景下易导致内存占用过高，需谨慎使用。

模块小结：本模块掌握了小体积CSV文件的全量读取方法，明确了返回数据类型及大文件场景的使用风险。

打开CSV文件并创建读取器（步骤同8.1）；
循环读取数据：通过for循环调用Read方法逐行读取，直到遇到io.EOF（文件结束）；
错误处理：区分io.EOF（正常结束）与其他读取错误；
处理单行数据：Read方法返回的record为字符串切片，每个元素对应CSV行的一列。

8.2.3 完整代码示例

package main

import (
    "encoding/csv"
    "fmt"
    "io"
    "log"
    "os"
)

func main() {
    file, err := os.Open("users.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    for {
        record, err := reader.Read()
        if err == io.EOF {
            break // 文件读取完成，退出循环
        }
        if err != nil {
            log.Println("Cannot read CSV file:", err)
        }
        
        // 遍历单行的每一列数据
        for _, value := range record {
            fmt.Printf("%s\n", value)
        }
    }
}

8.2.4 关键注意事项

Read方法每次仅读取一行数据，内存占用稳定，适合GB级以上的大型CSV文件；
需确保循环中正确捕获io.EOF，避免无限循环或错误处理遗漏。

模块小结：本模块掌握了大型CSV文件的逐行读取方法，核心是通过Read方法循环读取并处理io.EOF，兼顾内存效率与读取稳定性。

定义业务结构体：根据CSV字段定义对应结构体，指定字段类型；
读取CSV数据：通过ReadAll或逐行Read获取字符串格式数据；
类型转换与结构体实例化：遍历数据行，将字符串字段转换为结构体对应类型，创建结构体实例；
存储结构体数据：将实例添加到结构体切片中，便于后续业务处理。

8.3.3 完整代码示例

步骤1：定义User结构体

type User struct {
    Id        int
    FirstName string
    LastName  string
    Email     string
}

步骤2：数据转换（基于8.1的全量读取结果）

package main

import (
    "encoding/csv"
    "log"
    "os"
    "strconv"
)

type User struct {
    Id        int
    FirstName string
    LastName  string
    Email     string
}

func main() {
    // 1. 全量读取CSV数据
    file, err := os.Open("users.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()
    reader := csv.NewReader(file)
    rows, err := reader.ReadAll()
    if err != nil {
        log.Println("Cannot read CSV file:", err)
    }

    // 2. 转换为User结构体切片
    var users []User
    for _, row := range rows {
        // 跳过标题行（可选，若需忽略标题行参考8.4）
        if row[0] == "id" {
            continue
        }
        id, _ := strconv.Atoi(row[0]) // 字符串转整数
        user := User{
            Id:        id,
            FirstName: row[1],
            LastName:  row[2],
            Email:     row[3],
        }
        users = append(users, user)
    }
}

8.3.4 关键注意事项

数值类型字段（如Id）需通过strconv包进行类型转换，转换时需处理可能的错误（示例中省略了错误处理，生产环境需补充）；
结构体字段需与CSV列顺序严格对应，若列顺序不一致，需调整索引或使用标签映射。

模块小结：本模块掌握了将CSV字符串数据转换为Go结构体的方法，核心是字段类型转换与结构体实例化，实现数据的类型化管理。

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    file, err := os.Open("users.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    _, _ = reader.Read() // 读取并忽略标题行
    rows, err := reader.ReadAll() // 后续读取仅包含数据行
    if err != nil {
        log.Println("Cannot read CSV file:", err)
    }
}

8.4.4 关键注意事项

若标题行格式不固定（如存在空格、大小写差异），需增加灵活的判断逻辑，避免误跳过数据行；
逐行读取场景下，也可通过首次循环读取标题行并忽略，后续循环处理数据行。

模块小结：本模块掌握了两种忽略CSV标题行的方法，核心是提前读取或遍历跳过标题行，确保业务处理仅针对数据行。

打开目标CSV文件，创建csv.Reader实例；
配置分隔符：将reader.Comma字段设置为文件实际使用的分隔符（如分号;、制表符\t）；
正常读取数据：调用ReadAll或Read方法读取数据，读取逻辑与标准CSV一致。

8.5.3 完整代码示例（分号分隔）

假设存在users2.csv文件，内容如下：

id;first_name;last_name;email
1;Sausheong;Chang;<sausheong@email.com>
2;John;Doe;<john@email.com>

读取代码：

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    file, err := os.Open("users2.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    reader.Comma = ';' // 关键：设置分隔符为分号
    rows, err := reader.ReadAll()
    if err != nil {
        log.Println("Cannot read CSV file:", err)
    }
}

8.5.4 关键注意事项

reader.Comma仅支持单字符分隔符，若文件使用多字符分隔符，需自定义处理逻辑；
需准确确认文件的分隔符类型，避免配置错误导致数据解析异常。

模块小结：本模块掌握了自定义CSV分隔符的方法，核心是设置csv.Reader的Comma字段，适配非标准分隔符的CSV文件。

打开CSV文件，创建csv.Reader实例；
配置注释字符：将reader.Comment字段设置为注释起始字符（如#）；
读取数据：ReadAll或Read方法会自动跳过以注释字符开头的行。

8.6.3 完整代码示例

假设CSV文件内容如下：

id,first_name,last_name,email
1,Sausheong,Chang,<sausheong@email.com>
# 2,John,Doe,<john@email.com>

读取代码：

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    file, err := os.Open("users.csv")
    if err != nil {
        log.Println("Cannot open CSV file:", err)
    }
    defer file.Close()

    reader := csv.NewReader(file)
    reader.Comment = '#' // 关键：设置注释字符为#
    rows, err := reader.ReadAll()
    if err != nil {
        log.Println("Cannot read CSV file:", err)
    }
}

8.6.4 关键注意事项

CSV标准本身不支持注释，该功能为Goencoding/csv包的扩展能力；
注释字符需匹配文件中注释行的起始字符，若注释行有前置空格，需先处理空格；
注释行需整行以注释字符开头，否则无法被忽略。

模块小结：本模块掌握了通过配置csv.Reader的Comment字段忽略CSV注释行的方法，适配包含注释的非标准CSV文件。

创建目标文件：使用os.Create函数创建CSV文件，返回os.File实例；
准备写入数据：将数据整理为二维字符串数组[][]string（非字符串类型需先转换）；
创建CSV写入器：将文件实例传入csv.NewWriter，生成csv.Writer实例；
全量写入数据：调用WriteAll方法将所有数据写入文件；
资源释放：通过defer file.Close()确保文件句柄释放。

8.7.3 完整代码示例

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    // 1. 创建目标文件
    file, err := os.Create("new_users.csv")
    if err != nil {
        log.Println("Cannot create CSV file:", err)
    }
    defer file.Close()

    // 2. 准备写入数据（二维字符串数组）
    data := [][]string{
        {"id", "first_name", "last_name", "email"},
        {"1", "Sausheong", "Chang", "<sausheong@email.com>"},
        {"2", "John", "Doe", "<john@email.com>"},
    }

    // 3. 创建写入器并全量写入
    writer := csv.NewWriter(file)
    err = writer.WriteAll(data)
    if err != nil {
        log.Println("Cannot write to CSV file:", err)
    }
}

8.7.4 关键注意事项

非字符串类型数据（如整数、浮点数）需先转换为字符串，否则会导致写入失败；
WriteAll方法会自动处理行分隔符等格式，符合RFC 4180规范；
若文件已存在，os.Create会覆盖原有文件，需谨慎操作。

模块小结：本模块掌握了批量数据写入CSV文件的方法，核心是将数据整理为二维字符串数组并调用WriteAll，注意非字符串类型的转换与文件覆盖风险。

创建目标文件并初始化写入器（步骤同8.7）；
循环逐行写入：遍历数据行，调用Write方法逐行写入；
刷新缓冲区：写入完成后调用Flush方法，确保缓冲区数据写入文件；
错误检查：通过writer.Error()检查写入过程中是否发生错误。

8.8.3 完整代码示例

package main

import (
    "encoding/csv"
    "log"
    "os"
)

func main() {
    // 1. 创建目标文件
    file, err := os.Create("new_users.csv")
    if err != nil {
        log.Println("Cannot create CSV file:", err)
    }
    defer file.Close()

    // 2. 准备写入数据
    data := [][]string{
        {"id", "first_name", "last_name", "email"},
        {"1", "Sausheong", "Chang", "<sausheong@email.com>"},
        {"2", "John", "Doe", "<john@email.com>"},
    }

    // 3. 逐行写入
    writer := csv.NewWriter(file)
    for _, row := range data {
        err = writer.Write(row)
        if err != nil {
            log.Println("Cannot write to CSV file:", err)
        }
    }
    writer.Flush() // 关键：刷新缓冲区，确保数据写入文件

    // 4. 检查写入错误
    if err := writer.Error(); err != nil {
        log.Println("Error writing CSV:", err)
    }
}

8.8.4 关键注意事项

Write方法仅将数据写入缓冲区，需调用Flush才能将缓冲区数据写入磁盘；
大数据量场景下，可每写入一定行数（如1000行）调用一次Flush，避免缓冲区溢出；
writer.Error()需在Flush后调用，才能捕获写入过程中的所有错误。

模块小结：本模块掌握了CSV文件的逐行写入方法，核心是Write逐行写入+Flush刷新缓冲区，兼顾写入灵活性与数据可靠性。

本篇核心知识点速记

CSV基础：无统一强制标准，Goencoding/csv默认遵循RFC 4180，支持自定义分隔符、注释忽略等扩展能力；
读取方式：小文件用ReadAll全量读取（二维字符串数组），大文件用Read逐行读取（内存友好），均需处理文件打开/关闭与错误；
数据解析：CSV字符串数据可转换为Go结构体，需手动处理数值类型的类型转换，可通过提前读取/遍历跳过标题行；
格式适配：自定义分隔符设置reader.Comma，忽略注释行设置reader.Comment，适配非标准CSV文件；
写入方式：小数据量用WriteAll全量写入，大数据量/需控逻辑用Write逐行写入+Flush刷新缓冲区，非字符串类型需先转换。