我有一个test.csv可以逐行读取并确定每行有多少字节的方法。
这应该低于 37 个字节,因为我在 Windows 上,前两行\r\n总共添加了 4 个字节。
foo,bar,baz
100,200,300
400,500,600
Run Code Online (Sandbox Code Playgroud)
我想简单地使用 确定每行有多少字节csv.NewReader()。\n但是,我知道 csv.Reader在下面的代码中进行字节计数时不会计算每行中的逗号和。
我是否应该为每行中的逗号数 + 行数添加一些数学运算,为 -1 添加 2 个字节,\r\n为最后一行添加一个字节,因为它没有 \r\n?这感觉有点老套,所以我宁愿看看是否有更好的解决方案来解决我的字节计数问题。
我的代码:
package main
import (
"encoding/csv"
"fmt"
"io"
"log"
"os"
)
func main() {
file, err := os.Open("test.csv")
if err != nil {
log.Fatal(err)
}
defer file.Close()
fileInfo, err := file.Stat()
if err != nil {
log.Fatal(err)
}
fmt.Printf("file total bytes is %d\n", fileInfo.Size())
// init reader
reader := csv.NewReader(file)
// extract the header
headers, err := reader.Read()
if err != nil {
log.Fatal(err)
}
fmt.Printf("headers are: %+v\n", headers)
byteCounter := 0
for {
// if we reached end of file, stop
if err == io.EOF {
break
}
// read a record
record, err := reader.Read()
if err != nil {
log.Fatal(err)
}
// loop through each record and count how many bytes
for _, item := range record {
byteCounter += len(item)
fmt.Printf("record is %d bytes\n", len(item))
}
fmt.Println("total bytes so far is: ", byteCounter)
}
}
Run Code Online (Sandbox Code Playgroud)
小智 5
使用Reader.InputOffset获取文件中的当前位置:
fmt.Println("total bytes so far is: ", reader.InputOffset())
Run Code Online (Sandbox Code Playgroud)
https://go.dev/play/p/cgqq9woK02w
要获取每行的字节数,请减去先前的偏移量。
prevOffset := reader.InputOffset()
for {
...
// read a record
_, err := reader.Read()
...
fmt.Println("line length is: ", reader.InputOffset()-prevOffset)
prevOffset = reader.InputOffset()
}
Run Code Online (Sandbox Code Playgroud)
https://go.dev/play/p/cXCfogUBcdy