原来epub文件就是zip 可以这样提取html: unzip -p "奇特的一生 -- [俄罗斯] 达尼伊尔·格拉宁 [[俄罗斯] 达尼伊尔·格拉宁] -- 2023 -- 四川文艺出版社 -- 4cb434f3cb4230424a2f140d28b6564b -- Anna’s Archive.epub" "*.xhtml" "*.html" | textutil -convert txt -stdin -stdout > output.html
然后再使用w3m将html转成纯文本
然后再使用w3m将html转成纯文本