Replies: 8 comments 19 replies
-
增加了空行识别,减少token浪费,并加入了token计算功能,改进后原文json数据中编号不连续了,但并没有导致译文数据编号出错:
|
Beta Was this translation helpful? Give feedback.
-
你在测试的时候,ChatGPT 能始终返回有效的 JSON 格式吗?我看它文档上和提供的示例代码都有提示可能会返回无效的 JSON 响应。 |
Beta Was this translation helpful? Give feedback.
-
更新了prompt,现在使用Poe bot进行json格式化的翻译已经相当稳定:
|
Beta Was this translation helpful? Give feedback.
-
在使用gpt-3.5-turbo-16k进行超长文本翻译测试的过程中发现,较高的 |
Beta Was this translation helpful? Give feedback.
-
结论:向ChatGPT发送含json数据结构的原文进行长文本翻译测试,通过优化提示词,返回的译文json格式保留情况较好,但当合并翻译字数大于1600时,键名错位、漏翻等错误频率会超出容忍范围,即不能在不超过最大重试次数3的情况下翻译完成一本出版物。简单来说白嫖Poe bot足够稳定,gpt-3.5-turbo上将就着用,gpt-3.5-turbo-16k上力不从心。 |
Beta Was this translation helpful? Give feedback.
-
原本我都是直接匹配插件请求中{{id_xx}}的数字部分作为键值对的键,在尝试每次请求都从1开始重新索引键,并在提示词中说明键是行号后,单次响应时长减少了一半,
|
Beta Was this translation helpful? Give feedback.
-
今天测试了另外一种合并方式,简单地用换行符 这种形式在检查翻译内容的时候也挺方便,但是缺陷是万一其中有换行符被忽略或在编辑时被删掉,后面的译文就都错位了。因为还没有做大量测试,不知道 ChatGPT 会不会始终表现一致。感兴趣可以试试看。 |
Beta Was this translation helpful? Give feedback.
-
灵感来自于OpenAI最近更新中提到的Function calling功能,它能以json格式响应请求,按照通常的理解,ChatGPT的能力取决于其数据集,它的数据集中一定有很多与处理json相关的数据。所以我很快联想到把原文转换为json格式的数据,让ChatGPT翻译之后再以同样的json格式返回。
在我的测试中,即使不针对prompt进行优化,在数据格式的保持上依然表现良好。以下是我测试用的代码,由Perplexity AI辅助编写:
Beta Was this translation helpful? Give feedback.
All reactions