麦克雷 Mavom.cn
标题:
claude-sonnet-4-5-20250929使用体验
[打印本页]
作者:
18621862127
时间:
昨天 21:27
标题:
claude-sonnet-4-5-20250929使用体验
昨天,Anthropic发布了Claude 4.5。它有thinking版本。较之之前的Claude 3.1,它在社科方面有足够长进,同天的deepseek 3.2也在此方面达到Gemini 2.5 Pro的水准。但我重点说Claude。
作者:
18621862127
时间:
昨天 21:27
Claude 4.5不仅在社科方面达到了Gemini 2.5 Pro的水准,就连其所擅长的编程方面也有不小提升,它所展现的界面和内容丰富度是相当高的,毕竟爱因斯坦场方程的演绎本就困难,他不仅在3D,内存上有可观体验,它可提供的参数也很丰富。甚至让我感觉它有AGI的雏形,当然真正实现AGI所需的参数在此基础上要大的多。
作者:
18621862127
时间:
昨天 21:27
问题还是那两个,对剩余价值理论的理解与看法,爱因斯坦场方程的可视化界面。同天的deepseek 3.2终于摆脱了GPT-5的工程思维,能够做到有拿有放,不是为了反驳而反驳,最终只会在基本问题上抠字眼,当然Claude 4.5也达到了Gemini 2.5 Pro的水准。
作者:
asfasdasdasd
时间:
昨天 21:28
(, 下载次数: 0)
上传
点击文件名下载附件
gemini快能退休了
作者:
18621862127
时间:
昨天 21:28
但在编程上,deepseek 3.2仍有不足之处,和Claude 4.5甚至是Claude 4.1有很大差距,还是得加把劲。
作者:
18621862127
时间:
昨天 21:29
如果在社科方面,我觉得Gemini,Claude,deepseek都达到了AGI的水平,但是AGI是全方面的,所以目前Claude 4.5是唯一候选,它的底层架构应该和其他大模型领先一个身位。所以我在那两个问题的基础上有加了一道问题——电路题。
作者:
18621862127
时间:
昨天 21:29
大模型的看家本领是编程,但是再底层就是电路电子技术,如果不会电路电子技术,芯片你都做不出来,更何况手机,电脑,云计算了。可以说电路电子技术是根本。但是,这个电路电子不是高中一个电压源,它有很多,感兴趣可以学学电工学。
作者:
18621862127
时间:
昨天 21:30
当我问Claude 4.5一个电路题时,它答不出来,而且问一次一个答案,都不带重样的,而且在这里它的hallucination相当可怕,别的模型我还没有试,我估计情况更惨烈。这让我怀疑目前大模型上的数学和物理水平究竟到没到Ph.D水平。
欢迎光临 麦克雷 Mavom.cn (http://www.mavom.cn/)
Powered by Discuz! X3.5