文章目录
- 一、申请和测试代码
- 二、实测GPT4.0和星火认知大模型的对比
- 2.1 测试网站
- 2.2 经典问题提问对比
- 2.3 代码问题提问对比
- 2.4 论文问题对比
- 2.5 评价
一、申请和测试代码
在我之前的一篇文章中,我分享了如何申请星火认知大模型的内测,并提供了一份可以使用的python代码,具体见地址:
https://blog.csdn.net/weixin_46211269/article/details/131720896
二、实测GPT4.0和星火认知大模型的对比
2.1 测试网站
在我的镜像,接入了GPT4.0和星火认知大模型,因此我以它来做对比。地址:
https://ai.zcai.cloudhttps://chat.zcai.cloud/
2.2 经典问题提问对比
- 鲁迅和周树人是同一个人吗?
GPT4.0回答:
星火认知大模型回答:
- 树上有十只鸟,猎人用枪打死一只,树上还有几只鸟?
GPT4.0回答:
星火认知大模型回答:
2.3 代码问题提问对比
问题:请帮我完成一个完整的随机森林代码,包括加载数据、数据处理、模型训练、加载、可视化分析等。
GPT4.0回答:
# 导入所库from sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_scorefrom sklearn.datasets import load_irisimport matplotlib.pyplot as pltimport seaborn as snsimport pandas as pd# 加载数据iris = load_iris()X = iris.datay = iris.target# 数据处理X_train, X_test, y_train, y_test = train_test(X y, test_size=0.3, random_state=1)# 模型训练clf = RandomForestClassifier(n_estimators=100)clf.fit(X_train, y)# 模型评估y_pred = clf.predict(X_test)print('Accuracy: ', accuracy_score(y_test, y_pred))# 特征重要性可视化feature_imp = pd.Series(clf.feature_importances_,index=iris.feature_names).sort_values(ascending=False)sns.barplot(x=feature_imp, y=feature_imp.index)plt.xlabel('Feature Score')plt.ylabel('Features')plt.title("Visualizing Important Features")plt.show()
星火认知大模型回答:
# 导入所需库import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import train_test_split, cross_val_scorefrom sklearn.metrics import accuracy_score, confusion_matrix, classification_report# 加载数据data = pd.read_csv('data.csv')X = data.iloc[:, :-1].valuesy = data.iloc[:, -1].values# 数据处理(这里假设数据已经处理好,不需要额外处理)# 划分训练集和测试集X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 创建随机森林模型rf = RandomForestClassifier(n_estimators=100, random_state=42)# 训练模型rf.fit(X_train, y_train)# 预测y_pred = rf.predict(X_test)# 评估模型print("准确率:", accuracy_score(y_test, y_pred))print("混淆矩阵:", confusion_matrix(y_test, y_pred))print("分类报告:", classification_report(y_test, y_pred))# 可视化分析(这里假设数据已经可视化,不需要额外可视化)
2.4 论文问题对比
问题:我需要完成一篇论文,题目为:基于机器学习的欺诈分析检测,请你帮我生成一份合理的论文大纲,尽量细化到三级标题
GPT4.0回答:
一、引言1.1 研究背景1.2 研究目的1.3 研究意义.4 论文结二、机器学习概述2.1 器学习定义## 2.2 机器学习类型2.2.1 监督学习2.2.2 无监督学习2.2.3 半监督学习2.2.4 强化学习2.3 机器学习应用领域三、欺诈分析检测的必要性和挑战3.1 欺诈行为的严重性3.2 欺诈检测的挑战3.2.1 数据问题3.2.2 特征选择问题3.2.3 类别不平衡问题3.3 机器学习在欺诈检测中的作四、基机器学习的欺诈分析检测方法4.1 数据预处理4.1.1 数据清洗4.1.2 数据转换4.1.3 特征选择4.2 机器学习模型构建4.2.1 选择模型4.2.2 训练模型4.2.3 模型评估4.3 案例分析五、未来展望和研究方向5.1 引入新的机器学习技术5.2 欺诈分析检测模型的改进5.3 欺诈行为预防六、结论6.1 研究成果6.2 局限性6.3 对后续研究的建议
星火认知大模型回答:
I. 引言A. 研究背景和意义B. 国内外研究现状C. 研究内容和方法II. 机器学习基础A. 机器学习概述B. 支持向量机算法原理及应用C. 决策树算法原理及应用III. 欺诈行为分析与预测模型的建立A. 欺诈行为的概念和类型分析B. 建立欺诈检测预测模型的方法和流程1. 数据收集和预处理2. 特征提取和选择3. 建立分类器模型4. 对模型进行评估和优化IV. 实验设计与结果分析A. 实验设计1. 数据集介绍2. 评价指标的选择3. 实验环境配置B. 结果分析与讨论1. 对不同算法的性能比较2. 对不同特征的选取效果分析3. 对模型优化的效果分析V. 结论与展望A. 主要研究成果总结B.存在的问题及展望C.后续工作的建议和展望VI.参考文献
2.5 评价
经过三个方向的测试,在经典的问题上我们可以看出两者几乎没有区别;在代码问题上,几乎也没有差距,其中GPT4.0主要在解释上稍微多一点,实际回答的代码基本差不多;在论文方面,似乎也差不多,当然需要更多的测试。
虽然我只做了一些测试,并没有大面积的测试,从星火认知大模型的表现上来看,我已经感受到了国产AI的崛起。据小道消息,星火认知大模型下个月还会再次迭代,也许即将达到4.0的效果。当然,我们从这些基本的测试可以看出,星火认知大模型已经超过GPT3.5了,我的评价是它基于GPT3.5和GPT4.0之间,即将达到GPT4.0水平。
我很高兴地看到国产AI地崛起,希望将来会越做越好。