伪原创相关

基本思路

1.检测指定文件夹所有文件，读取所有txt或者word文件，并将其转换为utf8编码格式

ChangeEncodingToUtf8_3.py

ChangeEncodingToutf8.py

ChangeEncodingToutf8_2.py 均可用

2.检测文件字数，不足700字节（300字）的文件舍弃跳过

deleteNotEnoughWords.py可用

3.删除多余的空格，制表符，全角空格，换行符号

deleteSpacebarAndN.py可用

4.检测行数，如果行数小于5行，执行4.1。行数大于5行，执行5

4.1使用zh_cut.py进行中文分句

5.读取当前文件夹内的所有txt文件

5.1读取txt文件的所有段落（line），包括文件标题，按段落强制转换为string类型，分别进行赋值貌似可以使用readlines，然后使用for循环分别输出

5.2段落（包含标题）随机选择翻译软件翻译成日文，韩文，英文，赋值回当前字符串

5.3段落（包含标题）随机选择翻译软件翻译为中文

5.4新建t.txt，将翻译再翻译后的段落以"a+"增加写入的方式写入t.txt

5.5循环到下一个段落，重复5.2，直到所有段落都读取完毕

5.6移除原文件，将t.txt重命名为原文件名

6.读取下一个txt文件，重复5.1

其他

bd_translate.py

bing_translate.py

sg_translate.py 搜狗翻译并没有auto选项

这两个文件封装着百度翻译，必应翻译函数，搜狗翻译函数，在main.py中会被引用到

/article，这个文件夹本来是准备作为指定文件夹来存放txt文件的，然而并没有做出来

/fanyishili，找到的一些翻译示例，但是并未整合出来变成可用的

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

伪原创相关

基本思路

其他

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
article		article
fanyishili		fanyishili
ChangeEncodingToUtf8_3.py		ChangeEncodingToUtf8_3.py
ChangeEncodingToutf8.py		ChangeEncodingToutf8.py
ChangeEncodingToutf8_2.py		ChangeEncodingToutf8_2.py
README.md		README.md
bd_translate.py		bd_translate.py
bing_translate.py		bing_translate.py
deleteNotEnoughWords.py		deleteNotEnoughWords.py
deleteSpacebarAndN.py		deleteSpacebarAndN.py
main.py		main.py
sg_translate.py		sg_translate.py
zh_cut.py		zh_cut.py

luobo157/weiyuanchuang

Folders and files

Latest commit

History

Repository files navigation

伪原创相关

基本思路

其他

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages