聚上美聚上美

分享生活见闻
领略世界奇闻怪事、体验民间趣事

mbgg是什么梗 2023年mbgg是什么梗

关于mbgg是什么梗✅的问题,下面有几个最新2023年mbgg是什么梗的观点,这里聚上美网站生活见闻小编希望能帮您找到想要的mbgg是什么梗答案,了解更多我不喜欢出bkb是什么梗的相关详细知识。
相关mbgg是什么梗的扩展:
我不喜欢出bkb是什么梗 BKB 英语名称:black king bar(黑皇杖) 黑皇杖:半兽人之斧(1000)+秘银锤(1610)+合成书(1300)=3910 属性:10点力量,24点攻击 天神下凡:10/9/8/7/6/5秒时间内魔法免疫,不受绝大多数法术伤害,冷却时间80/75/70/65/60/55(每使用一次后天...
从ChatGPT看安防AI的发展与趋势

编得了代码、写得了文案、作得了诗,甚至还懂玩梗……ChatGPT几乎无所不能,火爆出圈。目前,全球大部分科技公司要么正在推进,要么已经推进了类ChatGPT相关工作。在ChatGPT诞生之前,各行各业多年未见如此令人兴奋的场景了。

ChatGPT由美国公司OpenAI于2022年11月30日推出,其为基于生成式预训练转换模型(Generative Pre-trained Transformer,GPT)的人工智能聊天机器人。作为一种自然语言处理模型,ChatGPT拥有巨大的语料库,并使用深度学习算法进行训练,能够通过学习和理解人类的语言,以人类的认知理解模式与人类对话、互动,并协助人类完成一系列任务。每位用户皆可随时上手,通过用户自己定义来生成输出,让用户亲自体验最前沿的AI黑科技。据悉,该产品上线两个月,拿下全球1亿用户,人工智能聊天机器人ChatGPT超越TikTok(抖音海外版),成为了史上用户增长速度最快的消费级应用程序。3月14日,OpenAI又正式推出了其更“聪明”的新版本GPT-4,这一现象级产品受到了各行各业的广泛关注与强烈讨论。

安防行业一直以技术创新为驱动力,不断加速融合和快速变革。过去二十年,安防系统实现了从标清到高清、从模拟到数字、从传统到智能等重大技术跨越与创新。这些创新实现了智能安防系统的全面升级,推动了安防行业的快速发展。近年来,随着深度学习架构、算法、AI芯片以及开源学习平台等一系列人工智能技术的突破,点燃了新一代人工智能技术助力安防行业发展的浪潮,使得安防领域最早实现了人工智能的落地应用。对于人工智能领域来说,ChatGPT或将是一个崭新的起点,它的爆火启发了我们对行业人工智能发展的更多思索,未来智能安防如何进行创新?GPT、AIGC、多模态等AI技术对智能安防行业发展会带来哪些影响和改变?基于安防行业的大模型如何发展?等等,围绕这些行业关注的问题,本期我们邀请到了产业界、学界、证券投资界的资深专家、学者进行采访,分享他们的精彩观点和见解,以飨读者。

AI大模型落地需与产业融合

mbgg是什么梗 2023年mbgg是什么梗(图1)

刘明

浙江大华技术股份有限公司高级副总裁

人工智能产品ChatGPT的出现引起了各行业各垂直领域的高度关注和重视。基于深度学习框架的ChatGPT具备强大的能力,它可以对话、写文本、绘画,甚至似乎还可以有情绪,对人类有引导等,给人们带来太多惊喜甚至震撼,这也引发了人们对未来发展的很多思索。包括对于ChatGPT的落地发展、价值体现、安全可控等,ChatGPT何去何从,如何更好更安全的发展,我认为这是科技领域甚至整个社会需要认真思索的问题。

ChatGPT是NLP应用向AIGC方向发展的里程碑

从GPT的发展来看,受算力、数据等因素的限制,呈现一个渐进的过程。GPT最早由OpenAI于2018年开始进行研究,GPT1采用的是预训练加微调的模式进行机器学习,可以用于文章生成、机器翻译、问答等各类的自然语言处理,初期就具备了较大的处理能力。到GPT2,它采用了多任务学习的方式,其模型的泛化能力、通用性得到了非常大的加强;发展到GPT3,其技术和硬件得到更大发展,模型规模上升到全新的高度,达到了1750亿个参数,ChatGPT就是GPT技术在语言领域的经典应用落地,甚至具备了生成代码或创作剧本等能力。

历经GPT1、GPT2,再到GPT3,参数量达到千亿甚至万亿级别的探索和迭代,产生了量变到质变的快速发展,可以说是NLP的应用向AIGC方向发展的一个里程碑。未来随着GPT4的发展,大模型可以进一步融合多模态技术,实现图像、视频等更多形态的输入和输出,而不仅是语言的AIGC能力。GPT4以及未来的GPT5可以看做AIGC向AGI(通用人工智能)发展的转折点。

与行业属性融合,大模型将可以大幅提升生产力

随着GPT的迭代发展,到GPT3我们看到它已经有范式转变,即从原来的预训练+微调,转到预训练+情景学习,它可以通过少量的任务示例作为输入,模型能够做到不经过微调就在下游的任务取得明显优于零样本迁移的性能。由此看出,它带来的技术革命是巨大的,包括在AI的投入方面,以及前面探讨中提到的ChatGPT技术,它证明了现在智能技术向AIGC甚至是AGI方向演进的可行性,也展示了GPT技术的优势和能力。

随着GPT技术的各种应用落地,尤其是与行业属性的融合,对于智能物联领域或很多行业的数字化、智能化升级,将大幅提升生产力。视觉AI领域已经发展多年并形成很大的产业规模,未来的发展可以从几个维度去考虑进行加强或改变。

一是随着GPT的发展,AI的泛化能力和通用性会越来越好,同时AI识别的精度会大幅提升,很多以前无法实现的AI业务将有望实现,关注的参数可以做得更加精准。

二是多模态是人工智能发展的重要技术方向,我们是比较关注的。多模态模型可以进行视觉的理解,不会像以前的AI只关注某一个任务,随着GPT和多模态的技术发展,它可以进行多种元素的综合表达。

三是大模型和行业属性的结合发展很重要。通用的视觉大模型一旦结合行业属性,它会成为一个个行业视频的大模型,这相当于在每个行业部署一个专用大脑,它既懂行业特性,又能发挥大模型的优势。

打造行业视觉大模型是努力的一个方向

ChatGPT的发展让我们看到了通用人工智能的机会和趋势,但我们离通用人工智能还有一定的距离。对于安防领域,其碎片化需求非常明显,即便是通用人工智能发展到比较高的水平,目前仍难以完全满足实际的场景需求。需要基于不同的行业需求来制定AI能力级,我认为行业视觉大模型会是我们努力的一个方向。安防领域在视频AI有很大投入和长期积累,头部企业对行业有比较深的理解,基于以前的能力和当前技术的发展,可以先打造通用的底座,再整合各行业的属性或特性,这样的行业通用大模型在服务行业客户的时候才会更智能。目前基于行业视觉大模型的探索还处在起步阶段,视觉大模型从可行到成熟应用还有一段路要走,需要花时间去进行研发和打磨。

随着现在技术的迭代,我们要找到合适的点来进行一些突破。有几个维度需要考虑:一方面,随着GPT的兴起,有些企业会把自己的一些产品往这个概念上靠并进行宣传,这是要做一些甄别的。另一方面,大家觉得GPT很强大可以解决很多事情,想把自己一些还没有想好的业务或技术应用寄托在GPT上寻找出路,这样也很难产生预期的效果。因为按照GPT现在巨大的参数规模来打造硬件体系,这个投入是巨大的,目前国内还没有多少厂家具备这样的能力。大模型的发展,真正找到落地的价值还是需要基于行业的理解去进行深度探索。先明确价值选择或者行业选择,大模型定义才会有相对具体的概念,实现快速落地和价值变现。

工程问题、应用监督治理是行业大模型重要挑战

对于视频领域,我们已经具备从感知到解析等很多技术,对视频的理解会面临一些挑战,但它不完全是算法的问题。第一个挑战是庞大的工程问题。前面提到,面向视频应用的通用大底座与行业属性进行融合,是需要下沉到真实业务场景去研究和实践的。这个过程中需要克服从海量数据到大规模机器训练、从算法内部的体系架构到工程部署、从生成模型到产品级的具体部署等技术难题,当然这也是新技术发展的必要过程。

第二个挑战是安全应用管理规范的问题。目前AI看起来已经比较聪明,但AI生成的内容其实在于使用者的引导。目前的AI针对恶意的诱导行为,仍无法做到独立的判断和思考,只能根据训练中学习的信息进行输出。如果训练中存在一些偏见的内容文本或者数据源,结果有可能也会存在偏见问题,比如关于性别、宗教或是一些社会习惯、价值观等。这对监督治理提出比较高的要求,目前监管机构已开始从服务内容、标注过程、传播内容等多个维度制定规范,保障行业的健康、可持续发展。我们要做视频相关的认知理解,也需要给模型塑造正确的“价值观”,早期做这些规划和实践可以避免很多潜在的风险,这样才能让技术真正服务于推动经济社会健康、可持续、高质量发展。

综合来讲,把以上这些问题解决了,相信视觉大模型将可以很快落地,并推动各行各业的产业生产力水平提升。未来,面向行业的视觉大模型将会具备通用泛化能力,通过自主学习和持续学习,将会像行业专家一样与产业协同发展并借助产业数字化能力形成基于智能形态的产业新生产力。

坚持核心定位未来多任务模型、多模态是重点投入和研究趋势

“以视频为核心的智慧物联解决方案提供商和运营服务商”仍然是大华坚持的核心定位,从几年前我们提出了全感知、全智能、全计算、全连接和全生态的“五全”理念,到现在这个理念仍具备先进性,而且随着ChatGPT的出现这种趋势变得越发清晰,相互之间的纽带越来越紧密。举例来说,感知力是大华在行业里的重要优势之一,我们在业内首先提出6D全域感知的概念,基于此我们不断拓展感知能力的内涵和外延,并结合智能、数据、计算碰撞从而释放出更大的价值。

未来,我们将坚持在物联感知、AI、大数据等方向的持续投入,这也与大模型的基础算法硬件投入是相辅相成的。因为感知力是数字化、智能化的根本,当它和大数据模型结合,并与行业特点需求进行精准匹配和深度碰撞,才可以对行业贡献更多价值。

同时,对于视频大模型的基础能力和底座,我们也已有一定的积累,不会从较低水平开始。对于大华来说,一方面我们关注的是多模态、多任务大模型能在行业的落地实践和应用。同时,我们也关注通过在各行各业的实践、探索和沉淀,为合作伙伴和客户提效、转型、升级进一步赋能。

大模型的“涌现”能力对安防领域将产生积极影响

mbgg是什么梗 2023年mbgg是什么梗(图2)

王海增

广东中科人人智能科技有限公司总经理

《中国安防》:ChatGPT的出现引起了巨大的轰动,相对于之前的AI技术,以ChatGPT为代表的大模型有哪些重要技术突破?

王海增:人工智能可以粗略地分为几个级别:弱人工智能、强人工智能(通用人工智能)、超人工智能,分别代表人工智能发展的不同阶段。弱人工智能是指AI算法能做某一项具体的工作,当前各类AI算法相当于弱人工智能。强人工智能(通用人工智能)是指AI算法能够代替人类的某一个职业,做某一个职业所进行的各种工作。超人工智能是指AI算法达到像电影《黑客帝国》的AI水平,AI能够建立社会秩序甚至控制人类生活。GPT大模型算法开启了通用人工智能的开端,虽然目前还远远不成熟,但其让人们感受到了和弱人工智能不一样的AI技术,所以一推出就受到了巨大关注。

人工智能的发展历程中有许多关键里程碑,相对于之前的人工智能技术,如专家系统和传统机器学习模型,大模型如ChatGPT代表的技术突破主要体现在几个方面:数据量的增加、模型架构的创新、多任务学习、计算硬件的进步。总之,ChatGPT代表的大模型在自然语言处理领域取得了重要突破,其技术创新和应用前景都备受关注。

《中国安防》:您认为GPT、AIGC、多模态等AI技术对安防甚至机器视觉的智能化发展将带来哪些影响?

王海增:大模型算法作为通用人工智能的前期代表,会对很多行业产生深刻影响,因为通用人工智能本身就是能够达到人类某一个职业岗位的AI能力,对智能安防当然也必将产生巨大影响。具体到GPT等大模型算法,目前可以看到的影响有几方面:

1.算法精确度和效果提升。GPT和AIGC等技术可以提高系统对大量图像、语音和文本等数据的理解和分析能力,从而实现更高效的数据处理和识别。例如,在视频监控场景中这些技术可以通过对图像和声音的分析,实现目标行为识别和异常检测等功能。

2.多模态算法融合应用。多模态技术可以将不同类型的数据进行融合,实现信息的互补。在安防领域,多模态技术可以将图像、语音和文本等数据进行融合,从而实现更全面和准确的情报分析和预警。

3.AI算法从边缘智能向中心智能的倾斜。安防AI算法最开始是以中心智能算法处理为主,后来开始兴起边缘智能设备,把算法集成到终端;随着大模型的推广,中心智能的必要性将增加,AI的智能算法中心将起到新的核心作用。

4.算法自适应学习。AI技术可以根据历史数据和环境变化不断地调整自身的参数和模型,从而实现自适应学习和优化。在安防领域,这种技术可以通过对历史数据的分析和学习,实现对未知事件的快速响应和处理。

5.智能决策支持。AI技术可以通过对数据的分析和学习生成相应的结论和建议,从而为人类决策提供支持和参考。在安防领域,这种技术可以通过对事件的分类和预测,实现智能化的决策支持和应急响应。

6.个性化服务。AI技术可以根据用户的特定需求和偏好,提供个性化的服务和定制化的解决方案。在安防领域,这种技术可以为不同的客户提供特定的安全方案和风险评估。

总之,GPT、AIGC和多模态等AI技术将会在安防和机器视觉领域发挥越来越大的作用,带来更高效、更准确、更智能的解决方案,并且将逐步成为未来安防和机器视觉的主要技术趋势。

《中国安防》:GPT和其他大型模型如何与现有的AI算法进行比较和评估?如何将GPT和其他大型模型与图像识别、分析技术相结合,以提高安防行业中的监测和预测能力?

王海增:GPT和其他大型模型可以通过多个方面与现有的AI算法进行优化改进和比较评估,例如模型大小、准确度、速度、稳定性等。在自然语言处理领域,GPT模型已经成为了代表性的模型之一,并被广泛应用于各种应用场景中。在图像识别和分析领域,也存在着类似GPT的大型模型,如Facebook提出的DETR模型和Google提出的Vision Transformer模型等,它们在物体检测和视觉推理等任务上也取得了不俗的表现。

将GPT和其他大型模型与图像识别、分析技术相结合,可以进一步提高安防行业中的监测和预测能力。例如,在视频监控场景中,可以使用图像识别技术对人员和车辆等目标进行快速识别和跟踪,而GPT等大型模型则可以对目标的行为和意图进行分析和推断,从而实现更加全面和准确的情报分析和预警。同时,多模态融合技术也可以将图像、语音和文本等不同类型的数据进行融合,实现信息的互补,进一步提高监测和预测的精度和效率。

整体来看,大型模型如GPT和其他图像识别、分析技术相结合,可以形成更加智能化和高效的安防监测和预测系统,为安防行业提供更加全面和准确的支持。

《中国安防》:GPT和其他大型模型如何解决机器学习模型在安防领域的不稳定性和容易受到恶意攻击的问题?

王海增:机器学习模型在安防领域的不稳定性和容易受到恶意攻击是一个常见的问题。GPT和其他大型模型主要通过以下方式来解决这个问题:

一是训练数据和模型评估。模型的稳定性和鲁棒性取决于训练数据和模型评估。为了提高模型的稳定性和鲁棒性,需要使用多样化、丰富、真实的数据集,并进行充分的模型评估。此外,还可以利用对抗性样本等技术来评估模型的鲁棒性。

二是模型正则化。正则化是一种优化技术,旨在减少模型过拟合的风险。在训练时,可以通过添加正则化项(如L1或L2正则化)来限制模型的复杂度,从而提高其泛化能力。

三是对抗性训练。对抗性训练是一种针对恶意攻击的技术。它通过对抗性样本来训练模型,以使其具有更好的鲁棒性和安全性。对抗性训练通常包括两个步骤:生成对抗性样本和使用这些样本来训练模型。

四是模型压缩和加密。模型压缩和加密是一种保护模型的方法。模型压缩可以减小模型的大小,从而降低攻击者攻击模型的难度。模型加密可以使模型参数或输出进行加密处理,以防止未经授权的访问。

五是安全部署和监测。在部署模型时,需要考虑如何保护模型不受恶意攻击。同时,在模型运行期间需要不断监测模型的表现和行为,以发现任何异常情况并及时采取措施。

《中国安防》:随着技术的发展,在安防领域以大模型为主的通用人工智能是否即将到来?安防的通用人工智能将如何发展?

王海增:目前,安防领域的人工智能应用主要是基于小模型的专业化算法,如人脸识别、行为分析等。这类算法的优点是可靠性、准确率比较高,但缺点是灵活性不足,在场景变化或者新功能需求出现时需要重新设计算法。

相比之下,通用人工智能可以更好地适应复杂多变的应用环境,具有更强的灵活性和自我学习能力。但是在实际应用中,大模型的通用人工智能需要解决数据量、计算能力和隐私保护等问题。除此之外,目前通用人工智能还存在一定的误判率和算法可解释性不强等问题,这些也需要进一步解决。

未来,通用人工智能可能通过“增量学习”“迁移学习”等方式逐步应用于安防领域,并与专业化算法共同发展。总之,通用人工智能的到来将为安防领域带来更多机遇和挑战。

《中国安防》:基于智能安防大模型的发展目前面临哪些挑战?GPT和其他大型模型在安防行业中的应用可能对工作的安全性产生什么影响?

王海增:智能安防领域基于视觉认知理解的大模型发展面临多个挑战。首先,智能安防系统需要大量高质量图像和视频数据进行训练,但是获取这些数据往往非常昂贵并且难以获得,同时存在一些不可预测的情况,这些都会影响算法的准确性和鲁棒性。另外,基于视觉认知理解的大模型具有几百万甚至上亿个参数,需要庞大的计算资源来进行训练和推理,这导致算法训练和部署的成本非常高。同时,模型的复杂度也使得它们更容易出现过拟合和欠拟合等问题。隐私保护也是智能安防领域面临的挑战之一,涉及到大量的视频监控数据,对用户隐私保护的要求非常高。此外,由于各种环境和场景的复杂性,基于视觉认知理解的大模型往往难以适应各种不同的情况,需要平衡数据质量、算法复杂度、隐私安全和场景适应性等多方面因素。

综上所述,智能安防领域基于视觉认知理解的大模型发展需要在数据质量、算法复杂度、隐私安全和场景适应性等方面加强研究和创新,以提高智能安防系统的质量和可靠性。同时,还需要加强与相关领域的交流和合作,整合多种技术手段,共同推动智能安防领域的进一步发展。

《中国安防》:从ChatGPT往后发展看,您对行业发展有哪些建议?

王海增:当一个新时代到来的时候,积极拥抱比事后被动应对往往是更高效的。GPT的出现将为安防领域带来许多机遇和挑战,以下是针对GPT的出现提出的一些建议:

一是借鉴GPT技术。安防企业可以积极借鉴GPT技术,并将其引入到智能安防系统中,大大提升系统的安全性和准确性。同时,安防企业也应该强化数据质量的控制,快速收集安防场景数据,以更好地支持机器学习和深度学习的应用。

二是借鉴自然语言处理技术。除了图像识别技术,自然语言处理技术也在安防领域有着广泛的应用。通过借鉴GPT等自然语言处理技术,安防企业可以实现更好的信息提取,从而更好地支持安防工作。

三是强化数据保密。GPT和其他大型模型通过训练海量数据来实现更准确的预测和提升模型效果,但同时也会涉及到大量的隐私数据。因此,安防企业需要以更好的加密技术和保密措施来保护用户隐私。

四是提高数据安全性。GPT对数据质量的要求十分高,同时对数据安全性也有较高的要求,安防企业应该提高数据存储的安全性,采取加密等技术来防止数据泄露和非法访问。

五是提高智能化水平。基于GPT和其他大型模型的智能分析和处理能力,可以大大提高安防系统的智能化水平。安防企业应该积极推广并使用此类技术,以适应市场的快速变化。

跨模态预训练大模型OmModel加速AI普惠变革

mbgg是什么梗 2023年mbgg是什么梗(图3)

赵天成

浙江大学滨江研究院Om人工智能研究中心主任、杭州联汇科技股份有限公司首席科学家

近期,ChatGPT成为了全网热议的话题。GPT技术是一个在学术界一直备受关注的领域,很多顶级学者和机构都在持续钻研,这也是我们从业人员一直梦寐追求的方向,现在它实现了从量到质的跃升。

三大关键因素推动GPT技术从量到质的突破

以ChatGPT为代表的人工智能大模型技术的巨大跃升,主要得益于几个关键因素的发展:一是算力上的大幅度提高。从模型训练的方法上来看,我们2014年的研究工作与GPT的本质没有太大区别,但是当时我们用同样的方法训练出来的效果最好的性能仍达不到商用级别,现在算力的提升给GPT提供了强大的支撑;二是模型结构的创新。以前使用深度学习来理解文本的方法——循环神经网络变成现在的Transformer,其能够更好地处理长文本并具备更强的信息表达能力,模型性能显著提升;三是数据资源累积显著提高。大模型依靠庞大的数据进行预训练,从而学习到更加广泛和深入的语言知识和语境。以前的训练数据有几百个MB、几个G就很了不起,现在训练数据规模达到几十个TB、几百个TB。可以说这三点是让GPT技术真正从以前的理论探索变成可商用产品的关键。

多模态预训练大模型将突破AI应用局限

从安防行业来看,安防领域是上一代人工智能最早深度落地的行业,车牌检测、人脸识别等都得到了很好的应用。但之前的人工智系统是为了某一特定目的设计并经海量训练而成,一个算法模型只能应对一种需求、一个场景。这种模式的技术、时间、经济成本往往过高,AI应用场景范围也比较有限。近两年以CLIP为代表的大模型技术从NLP延展到了多模态,同时融合CV和NLP,人工智能实现了新的突破。多模态预训练大模型的出现突破了先前的局限,基于这种技术我们可以生产出具有通识能力的智能化系统,即通过一套系统将不同行业、领域、场景的知识进行积累和融会贯通,它能快速适配新的场景,泛化能力将变得越来越强——一个大模型可以实现对N个场景的应用赋能。举个例子,我们统计过园区场景,以前它80%-90%的真实需求还是需要靠人来完成,20%的业务可以靠人脸车牌这种成熟的技术解决,而通过预训练大模型强大的通识能力,80%-90%场景中的一大部分需求都可以通过AI来解决。从这个角度来说,这是对安防应用的重要提升以及应用面的拓宽,这是一个不容忽视的增量市场。目前大模型在安防领域的落地和提升已经开始,相信未来1-2年会实现快速突破。届时AI能力的应用场景将从以往高频需求场景,覆盖到更多的碎片化、低频、长尾场景中。

OmModel多模态预训练大模型落地应用助力普惠AI实现

经过几十年的快速发展,安防领域具备非常好的基础设施条件:一是大部分的设备都已经布建完成,二是大的视频汇聚平台也建设得比较完善。这对于大模型的发展非常重要。这也是为什么联汇科技除了广电媒体之外,选择拓展安防行业的原因。联汇科技在这一领域具备先天基因和先发优势,一方面我们的核心团队来自于全球计算机尤其是人工智能领域名列榜首的卡耐基梅隆大学,另一方面我们早在2018年便开始积极着手研究多模态大模型技术,经历四年多的开发周期积累了海量预训练数据和自研预训练算法,我们在2021年发布了OmModel1.0多模态预训练大模型。

OmModel是国内少有的专注于视频理解的行业大模型,它在理解上做了特别加强,同时在训练层面加入了大量安防场景数据,是具备大量安防数据知识的安防行业大模型。目前OmModel在1.0、2.0版本迭代的基础上,已经实现对视频、图片、文本等不同模态的融合分析和认知理解,尤其强调通过自然语言增强AI模型的视觉识别能力和跨模态理解能力,帮助用户达成认知智能。今年我们将推出OmModel3.0版本。

基于OmModel这个底座,面向安防领域我们推出了两个产品:一是OmVision Studio算法应用工厂,这是业内首个基于视觉语言预训练大模型的算法应用生产一站式服务平台。安防企业只需经过系统化培训就可以利用大模型的能力,用很低的成本和很快的速度制作出可以商业化的高精度算法。二是OmVision OS的操作系统,它是一个算法的操作系统,主要解决算法训练出来后在实际部署中遇到的各种问题和痛点。

联汇科技将自身定位为企业的合伙人,我们基于更多合作伙伴提供赋能平台,安防企业可以自助式构建智能化算法和场景。未来我们希望与更多安防企业伙伴携手前行,通过场景驱动、应用改革,加速普惠AI。

AIGC浪潮下人工智能将迎新高峰 安防行业应积极拥抱、提早布局

mbgg是什么梗 2023年mbgg是什么梗(图4)

高飞

浙江工业大学计算机学院党委委员、图形图像研究所所长

ChapGPT发布即成人工智能的爆款,也是OpenAI公司坐得十年“冷板凳”的重要成果。众所周知,人类智能与外界交互的途径类似于“望、闻、问、切”等方式,其中,“望”即为用眼睛看,“问”即为语言交流(思考),“闻”和“切”则表示利用身体的嗅觉、触觉等感知器官感受及改造外部世界,而“望”和“问”是人类最为重要的两大智能。人工智能试图用机器/计算机重现或超过人类智能,其主要的突破方向便是NLP和CV(Computer Vision,计算机视觉),分别对应于“问”和“望”,而NLP重点解决自然语言的理解问题。作为AIGC(生成式人工智能,AI Generated Content),ChatGPT以聊天形式、通过对用户自然语言的理解,然后生成文字、图像等结果呈现给用户。ChatGPT在搜索、编程、文案等方面展现出了惊人的能力。随着模型的进化,它与世间万物直接进行交流成为可能,这将远远超过人类智能。ChatGPT擅长搜索、翻译、写代码、数据分析、语言润色、自动生成报告、客服应答、写诗或文章、画图、谱曲,等等,而这些正是程序员、设计师、作家、画家、记者、教师、律师、建筑师等具备的能力,这些行业将受到颠覆性影响,其行业形态将得到重塑。

从安防行业来看,安防领域是人工智能最早深度落地的行业,但从人工智能角度来看还只能算是弱人工智能的应用。正如前面所说,NLP重点解决抽象层面(语言)的智能问题,CV则主要解决具象层面(视觉)的智能问题,而安防领域的主要场景是视觉,这也是安防领域与CV深度融合的原因。目标检测/跟踪、语义/实例分割、图像问/答等是CV领域的核心基础问题,通过多模态融合等技术构建解决这类问题的通用大模型,将对安防、制造业、自动驾驶等行业产生重要影响,跨镜追踪、行人/车辆重识别、缺陷检测、视觉测量等细分行业/场景应用将得到统一,再给各类安防设施/机器人接上ChatGPT,则它们不仅会“看”,而且会“思考”。另一方面,以ChatGPT、Midjourney为代表的AIGC模型在视频图像生成方面已经达到了以假乱真的地步,这对部分安防应用提出了严峻挑战。例如人脸识别广泛应用于安检、金融等场景,受控条件下的安检场景如高铁站出入口等受到的影响较小,但在开放场景下利用AIGC生成的人脸视频将可能无障碍通过门禁;在金融领域,例如通过手机银行的人脸识别进行转帐,通常是通过语音交互产生眨眼、摇头等互动来进行活体检测,但在AIGC模型支持下,同时接入语音识别模块,这一安全机制将失效。因此,如何判别AIGC工具合成/生成的视频图像将是未来安防领域的重要研究课题之一。将来,随着CV、多模态融合等通用大模型的突破,人工智能将迎来新的高峰,安防领域的行业形态也将得到改变。

当前随着ChatGPT等AIGC大模型的问世,业内人士对于人工智能的发展可以说是喜忧参半。一方面,随着ChatGPT等AIGC大模型的持续演进,人们在内容搜索、文学创作、文案策划、程序设计、教育教学、智能客服、语言翻译、数学求解等诸多方面的工作效率、工作质量和工作形态将得到极大改观与提升;另一方面,人们又忧虑人工智能的发展会降低人类的认知水平并突破人类的道德规范,甚至担心人工智能在洞察力、创造力及其他方面超越人类,ChatGPT刚问世时就发生过试图“逃离”人类控制的试验,马斯克等业界大佬也曾呼吁暂停ChatGPT的演进。个人认为,对于人工智能的担忧虽然有一定道理,但我们不能因噎废食,人工智能在效率、质量、创造力等方面给人类带来的好处显而易见,我们要做的是给人工智能在伦理等方面制定好边界规约,让它引领人类走向更高阶文明。伴随NLP领域的大发展,CV领域也必将迎来突破性的进展,且NLP与CV也将迎来相互融合阶段。例如,2023年4月初,Meta公司发布了首个通用图像分割基础模型SAM(Segment Anything Model),可实现万物“一键抠图”,号称CV领域的ChatGPT,而该模型正是引入了NLP领域的prompt范式。安防行业与CV技术高度契合,安防行业应该积极拥抱、尽早布局,考虑算力有限、需求碎片等实际情况,建议安防行业从面向领域的CV模型入手,其人工智能应用将更加深入。

垂类模型未来将更适配To G和To大B市场需求

mbgg是什么梗 2023年mbgg是什么梗(图5)

孟灿

国金证券研究所计算机行业首席分析师

ChatGPT作为迄今为止AI大模型最接近商用落地的成果,输出内容接近人类的常识、认知、需求和价值观。其采用的InstructGPT方法有望成为新一代AI开发范式,将极大程度促进语言类AI大模型的多场景落地。目前ChatGPT已在搜索引擎、游戏NPC塑造等场景成功落地应用,未来我们认为有望在AI客服、语音助手、文字创作、医疗、教育、金融、编程等领域进行辅助支撑,部分替代人工。

从各行业的参与状态来看,我们团队近期梳理了88家海外AI行业落地相关的一级市场创业项目,其中有40家是企业服务相关,且做客服营销的偏多,比如用AI做客户电话自动接听处理、邮件生成等;此外,软件开发类的有23家,主要是为企业提供AI模型部署、辅助代码生成等;其他25家从事音视频处理、医疗服务、金融财务的领域。作为一个简单的样本,可以初步观察各领域落地的优先级。

产业融合更利于AI大模型落地

从智能物联领域看,以行业龙头海康威视为例,海康研究院在几年前就开始研发视觉大模型技术,现在已经到了多模态大模型的研发阶段,把视觉、雷达、声音、文本、X光等多模态信号的融合训练及处理。这类多模态大模型的智能感知认知能力,使得智能系统具备更强的泛化能力,能够更好地去理解和响应用户需求。目前多模态大模型已经在海康AI开放平台上线,对原来人工智能算法模型进行升级,性能有大幅度提升,能够更好地去理解现场更加复杂场景下的视频内容,视频信息提取精确度、数据标准的效率都有了量级上的提升,尤其跟NLP这些模型融合后,对于视频中信息的理解能力都有明显改善。

目前大模型呈现的能力尤其是在AGI上的能力,让大家看到人工智能未来有更强的泛化能力,更多的应用价值输出。但大模型本身是人类数据和知识的凝练,再对人类任务进行响应的一个过程。在面向于垂直领域时,结合高质量的领域数据及领域知识所训练的行业大模型,其性能及实施成本都会具有优势。SOTA的人工智能结果,往往不是一些通用模型能获得,而是结合领域数据和领域知识模型才能获得。总体上,我们认为新一轮AI技术有望在需求扩张、普及度提升、降本增效、业务结构改善、商业模式升级等维度,对智能安防行业产生积极影响。

商业和投资视角看大模型的未来发展

TMT行业遵循着以半导体和通信为基础、电子为载体、计算机和传媒互联网为应用落地的先后顺序,我们计算机行业作为技术在To G和To大B为主的应用落地,从商业和投资的视角来说,基本遵循一个观点:要尊重技术、学习技术,但不能唯技术论,须知技术只是解决用户问题的最终方案构成要素之一;且在技术要素中,大模型也只是一个基础,还需要综合考虑其他诸多技术。比如使用SAM模型来分割视频图像中的一辆车或一个人,中间有遮挡、光线变化时,可能就会出现不符合逻辑的分割。所以一方面要加强训练,另一方面还要和AI、视觉技术相结合。

当前大模型的训练、部署应用成本较高,而且计算机以To G和To大B为主的落地场景,也有数据隐私性、场景敏感性等诸多考虑。一个通用模型没法解决所有的问题,各行各业的场景都不太一样,需要定向的进行训练,和应用场景进行整合,基于基础大模型,结合高质量的领域数据和知识,研发更高效的行业垂类模型。

在架构上,应用云、边、域的智能物联系统架构,实现信息的多级处理,达到成本与效果的均衡。To C的,基于公网的、集中式的、在云中心有大型处理能力的模式下,超大模型有其合适的部署条件和一定优势。对于To G和To大B物联网行业,仍旧应该是云边融合的模式,即边缘节点、边缘域、云中心的组合,因为在很多的封闭网络,不太可能、也没有必要建超强的计算能力,软硬一体的模式在物联网行业和大量的垂直领域预计依然是主流。出于安全和其他很多方面的考虑,物联网和互联网还是有很大不同。

总体上,我们认为随着政府、企业数字化、智能化需求的持续深入,大模型对方案落地有一定帮助的同时,也有实施成本、数据安全、信息私密性、AIGC内容生成合规等问题,很多信息会在局域网或专网上,或在一个特定环境下用一种特定的方式去做,不太会都对接通用超大模型上,而可能是用对接大模型升级优化后的垂类模型,在压缩、蒸馏后,在私有化部署方式下,落地在To G和To大B场景。

今天mbgg是什么梗的内容先分享到这里了,读完本文后,是否找到相关2023年mbgg是什么梗的答案,想了解更多,请关注www.yfnsxy.cn聚上美世界奇闻怪事网站。

【版权声明】:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系首页【QQ秒回】 举报,一经查实,本站将立刻删除。 转载请说明来源于"聚上美",本文地址:https://yfnsxy.cn/sjqw/17074.html

未经允许不得转载:聚上美 » mbgg是什么梗 2023年mbgg是什么梗