前言
近期,DeepSeek AI大模型引起了社会的广泛关注,目前各行各业都在研究AI大模型在各自业务场景中的实战应用方案。本文中笔者想要和大家探索的是DeepSeek AI在打击新型网络犯罪场景下的实战应用思考,以及在具体业务中部署使用需要注意的局限性问题。DeepSeek AI大模型凭借自身强大的数据处理能力和模式识别精度,能够有效挖掘海量数据中的隐藏信息,为公安人员提供及时、准确、全面的情报支持。其作为一项集成了深度学习、图像识别与自然语言处理等前沿技术的智能分析AI模型,在公安业务实战中的应用日益广泛,成为了提升警务效能、实现精准打击的关键工具。
本文仅代表笔者个人观点,如有不当,请指正。
知识导读
DeepSeek作为⼀款国产自主研发的AI大模型,与目前市面上其他主流的AI大模型(例如:文心一言、OpenAI)不同的是,其对自身AI大模型进行了开源,这使得任何开发者可以根据开源协议免费使用Deepseek的开源模型进行本地化部署,极⼤的促进了AI行业的生态发展,降低了AI大模型的开发成本并且加速技术迭代的进程。
对于组织内部使用AI大模型,推荐本地化部署DeepSeek AI大模型。本地化部署不仅可以避免网络波动带来的影响,还能提供更高的隐私性保护和数据安全性。开发者在对DeepSeek进行本地化部署时,以DeepSeek-R1模型举例,其提供了多个版本以供下载使用。不同版本对于硬件设备的计算和存储需求都各不相同。开发者可以根据使用需求,选择合适的版本,以此有效节省成本,同时提升部署效率。
1、相信看到这里大家可能会有疑问,上述版本中的B是什么意思?
在AI模型中,B代表数字“billion”(十亿),1B等于10亿个参数,671B就表示6710亿个参数,这些模型的参数量越大,所能处理的数据和生成的内容就越复杂,但同时也需要更多的计算资源,更高性能的硬件来运行。每个版本相较于前⼀个版本的计算能力都有显著提升,尤其是从70B 到671B,模型计算能力大幅度提升,能够处理更复杂的上下文和细节问题。
2、基础模型和671B的模型是什么关系呢?
通俗来讲,就是残血版和满血版的区别,但是专业⼀点来讲,在机器学习中,模型蒸馏是⼀种优化技术,通过模仿教师模型的输出,训练⼀个较小的学生模型,从而实现知识的传递。教师模型通常具有较高的性能,但计算成本高昂,而学生模型则更加轻量级,推理速度更快,且内存占用更少。使用蒸馏版(残血版)的目的也就是以更小的成本使用接近于高性能模型的功能,但是假设在成本允许的情况下,满血版模型的性能⼀定是远远优于蒸馏后的模型的。举个例子,1.5B作为低性能的AI模型仅能用于简单的文档处理和语义分析,但是优点在于成本低廉,仅需使用⼀台家用计算机就可以快速部署,而671B⼀般用于商业或科研用途,也适用于对AI性能有较高需求的场景,但是部署成本较大,预估DeepSeek-R1-671B版本的部署成本大致范围可能在200-300万元之间。
671B模型硬件需求如下:
CPU:至少64核的高性能CPU,如AMD EPYC或Intel Xeon
显卡:NVIDIA A100或多个V100显卡,甚至需要集群支持
内存:至少512GB RAM
磁盘空间:至少2TB空闲空间
多模态是指可以处理多种类型的数据,比如纯文字、图片、文档等,而单⼀模态的模型是指只能处理文字或图片或声音的模型。
4、DeepSeek在中美博弈对抗态势的影响?
想必大家都知道DeepSeek被美国攻击的事件,其中以美国英伟达市值暴跌2600亿美元举例,DeepSeek对技术路线的变革是冲击英伟达市场的主要问题。在以往AI行业的发展中,想要提升AI的性能,最简单快捷的方式就是堆硬件,以不断提升硬件性能来获得更高算力效率,这时AI行业对于高端显卡的需求是非常巨大的,可以说英伟达把控着AI行业的下层基础。但是这时DeepSeek通过技术路径创新,以优化架构、算法的方式来降低对算力的需求,降低的算力需求可以达到近20倍,这也使得未来通过优化算法架构来提升算力效率的方式成为发展趋势,另一方面也给国内芯片厂商(寒武纪、华为昇腾)间接提供了生机,国内AI行业也无需害怕国外制裁限制芯片出口中国大陆,所以看似是对DeepSeek的攻击,更是中美博弈对抗的表现之一。而且,正如上面所讲,DeepSeek是开源的,这使得未来AI行业发展,通过优化算法、架构提升算力或将成为主流趋势,对整个AI行业生态影响深远。
AI大模型实战应用思考
现在言归正传,首先我们应该思考,DeepSeek AI大模型对我们的工作能够有哪些帮助?
笔者认为,根据用户的站位不同,其所能解决的问题是不同的。对于⼀些普通用户来讲,可能查阅资料,生成文档就已经占据了绝大多数的使用场景。但是,当用户使用场景具有明确的指向性,例如对于打击新型网络犯罪的⼀线办案人员来说,我们可以使用DeepSeek模型通过自然语言处理(NLP)技术对一些新发案件的案情进行快速解析,实际上就是帮助办案人员快速锁定并提取⼀些关键要素,帮助办案人员快速判断涉案线索查证维度,将非结构化的基本案情线索展开分析,从而降低了办案过程中对于侦查的⼀定们槛,大大提高了办案效率。
1、类案、串并案关联分析
对于目前打击网络犯罪的⼀个工作重点——类案打击,办案人员可以快速对某⼀类案件进行聚合归类或者通过训练AI大模型实现对于疑似串并案进行线索关联,关键的技术点就在于需要办案人员“指导”AI模型如何进行关联,传授方法。例如,在冒充公检法类诈骗的案件中,我们可以通过分析APK包的名称、诈骗话术、冒充的公安姓名、电话号码、通讯软件账号、远程控制软件服务ID等不同方面进行初步关联,后续办案人员可以根据AI输出的数据进行⼆次校验,大大简化了工作负担。目前,大部分AI模型均支持多模态,这使得在具体工作中对于⼀些复杂格式的数据源的处理更加便捷。
首先回到第⼀个问题,AI智能监管出口流量是否可行?我认为是可行的,设想⼀下,假设我们想要在某地区的出口流量进行监管封控⼀些非法网站浏览,这样的网站包括但不限于涉诈、涉恐、涉黄等标签的站点。较为传统的方式就是以建立黑库的方式进行拦截,这样的方式存在的弊端就是如何保证黑库的数据实时更新,如何保证数据更新的效率,以及⼀些历史为黑名单但是变更主体后为正常业务域名或IP如何判断。最大的问题就是不能影响正常业务的网络访问,需要把握好监管的分寸。如果接入AI模型后,我们可以智能分析网站的涉诈系数。这项工作目前已经有很多成熟的案例,我们只需要学习现成的方法手段即可。
第二个问题,接入后的利弊关系是怎样的?我认为在条件宽松的情况下,接入的利应该是大于弊的。接入AI模型对于我们开展工作无疑帮助巨大,管控起对外流量,可以说对反诈预警管制工作具有重大帮助。举个通俗点的例子,当限制⼀个人无法走出自家门口时,线下接触式受伤的概率是不是就非常小了(当然概率不是为0),而如果该地区的潜在受害人无法访问到涉诈站点就被拦截并回显“您正在访问涉诈站点”,这样是否可以减少很多电信网络诈骗的发案数量呢?大道理小道理反映的问题都是⼀样的,通过AI模型对黑灰色网站进行分析标记的效率要远远大于传统黑库的更新效率。但是接入AI所应该考虑的弊端也是需要考虑的重点,我们如何保证AI识别的准确性,笔者认为关于准确度的问题应在不断训练中进行完善,理论上当本地化部署的AI模型通过不断训练业务知识,其工作适配度也会不断提高。
最后⼀个问题,如何寻找⼀个平衡点?我们应在采取措施之前,寻找⼀个平衡点,即如何在不影响业务的情况下去接入⼀个新鲜的事物。首先,应该让AI模型介入流量分析工作但不执行操作,在⼀定周期内持续观测黑灰网站识别的精准程度,不断以并行流量的方式投喂流量数据提高精准度。当精准度达到我们的预期时就可以逐步介入封控工作,尽可能将接入可能导致的弊端风险减少,选择较为保守温和的方式开展这项工作,把握好封控的强度,接入后不能直接加入具体封控工作。这也是我们讲为什么要寻找⼀个平衡点,在AI模型接入的利处和弊端之间做取舍,使两者之间达到⼀个平衡,既能满足我们的业务需求又能在实际工作中稳定、高效的运行,为未来的工作开展提供助力。
限于文字篇幅,这里我们就不展开论述了,实际上地区出口流量AI智能监管在实际业务部署时应考虑的情况远不止上述三点,想要在实战中应用还是需要组织专家团队座谈展开论证,具体问题具体分析,将业务需求与技术实现落地结合。有些时候思路构想是不错的,但是落地到实际工作中还是会存在各种各样的问题,存在一定的偏差,需要我们在不断碰撞中探索解决方案。
上文分析了DeepSeek AI大模型在打击新型网络犯罪场景下的实战应用思考,那么本章节我们不谈优点只讲困难。我始终认为如果任何新兴事物的落地都需要考虑各种实际问题,都⼀定会存在某些局限性,有些局限是显而易见的,有些局限却是潜在的,可能是客观存在的,但是我们以往不曾想到的实际问题,这些问题在落地时都应考虑到,将这些问题想到,做到,避免以后潜在的问题造成⼀些重大影响。
相信通过上面提到的⼀些局限性大家也能有所思考,对于AI模型应用到实际工作中这些都是需要必要考虑的环节,当然这也是浮于表面的问题,由于本文仅作科普就不进行深入讨论了,仅进行抛砖引玉。无疑AI模型应用在打击新型网络犯罪业务的优点非常大,但是其短板也是客观存在的,我们需要正视这些问题可能导致的后续影响,寻找方案去解决它,真正的将AI转换为工作的重要助力。
我平常也比较喜欢尝试将⼀些实战中的经验论转换并落地从而赋能后续的工作,但是很多技术研究对于基层办案单位来讲应用场景并不多。所以,贴合实际需求也是我想表达的意思,将本职工作做精,做细,做实的前提下,总结技战法,开发工具落地解决实战中的痛点问题是我目前的的工作重心。本文想要告诉大家的是,在关注新兴事物带来的正向价值的同时,也要关注其负面影响即局限性的问题,是否确切的贴合自身业务需求,以辩证的思维看待AI对于我们工作所带来的影响。限于篇幅,其实还有很多想要表达的地方没有写下来,纸短情长哈哈哈,欢迎大家来⼀起交流分享。
最后,祝大家心想事成,美梦成真!临近毕业,也祝自己,得偿所愿!
发表评论
您还未登录,请先登录。
登录