我让ChatGPT和DeepSeek做了同一道简单的高中数学题,前者更胜一筹
这道数学题是:现给定自然数x, y, z,满足x^3可以被y整除,y^3可以被z整除,z^3可以被x整除,求证:(x+y+z)^13可以被xyz整除。
严格而言,它并不是一个典型的高中习题,在美国不是,在中国或许是——有些省份的学生选修初等数论,这里只需初中程度的知识和应试技能即可解决,若有数论知识则只会更简单,因此一个通用人工智能是被期望理所应当做出它的。
结果是ChatGPT让我较为满意地做出了这道题,假如不纠结它对特殊情况的忽略,其做法如下:
将x, y, z共有的任意质因数p(显然它们共享所有质因数)的指数分别在它们质因数展开后命名a, b, c,那么题目条件就相当于b≤3a, c≤3b, a≤3c总是成立。我们知道x+y+z是p的倍数,且它分解出后p的指数的最小时为min{a,b,c},那么对于(x+y+z)^13就是13min{a,b,c}。题中x, y, z的角色是任意的,那么不妨设a为min{a,b,c},则xyz分解出的p的指数=a+b+c≤a+3a+3b≤a+3a+9a=13a=13min{a,b,c},证完。
尽管DeepSeek也做出了差不多的东西,但它的过程中犯了错误,那就是把上文本来应为最小时处当作为“就是”。而且ChatGPT花了10秒就加载完了整篇回答,与之对比,DeepSeek思考了3分钟有余。






----------以下,则是DeepSeek的作答,其中有大篇“思考”部分,已略去--------



严格而言,它并不是一个典型的高中习题,在美国不是,在中国或许是——有些省份的学生选修初等数论,这里只需初中程度的知识和应试技能即可解决,若有数论知识则只会更简单,因此一个通用人工智能是被期望理所应当做出它的。
结果是ChatGPT让我较为满意地做出了这道题,假如不纠结它对特殊情况的忽略,其做法如下:
将x, y, z共有的任意质因数p(显然它们共享所有质因数)的指数分别在它们质因数展开后命名a, b, c,那么题目条件就相当于b≤3a, c≤3b, a≤3c总是成立。我们知道x+y+z是p的倍数,且它分解出后p的指数的最小时为min{a,b,c},那么对于(x+y+z)^13就是13min{a,b,c}。题中x, y, z的角色是任意的,那么不妨设a为min{a,b,c},则xyz分解出的p的指数=a+b+c≤a+3a+3b≤a+3a+9a=13a=13min{a,b,c},证完。
尽管DeepSeek也做出了差不多的东西,但它的过程中犯了错误,那就是把上文本来应为最小时处当作为“就是”。而且ChatGPT花了10秒就加载完了整篇回答,与之对比,DeepSeek思考了3分钟有余。






----------以下,则是DeepSeek的作答,其中有大篇“思考”部分,已略去--------



11 个评论
同志肯去自己体验很好
这种比较意义其实不大, 作为竞争者。Deepseek其实是比价格而不是性能, deepseek vs openai好比BYD和奔驰
後者表现好应该毫无争议 (别的小同志努力证明其他都是白费力气)
现在颠覆共产党的核心问题是这东西到底价格有没有优势 . 我目前的观察是利好共产党药丸, 当然还有其他严重的问题 留着日后慢慢谈
* 顺便提一句, 你做的这个测试, 在他们开源的版本里多半是做不出来 (欢迎证明我错了)
这种比较意义其实不大, 作为竞争者。Deepseek其实是比价格而不是性能, deepseek vs openai好比BYD和奔驰
後者表现好应该毫无争议 (别的小同志努力证明其他都是白费力气)
现在颠覆共产党的核心问题是这东西到底价格有没有优势 . 我目前的观察是利好共产党药丸, 当然还有其他严重的问题 留着日后慢慢谈
* 顺便提一句, 你做的这个测试, 在他们开源的版本里多半是做不出来 (欢迎证明我错了)