Skip to content

AIGC基础知识介绍

说起近几年的热门科技词汇,AIGC当之无愧位列前列。

根据量子位智库数据,2023年中国AIGC市场规模约为170亿元,预计2025年之前,中国AIGC市场规模增长率都将维持在25%左右,2025年市场规模将达到257亿元。2025年起,随着底层大模型逐步对外开放,中间层及应用层将迎来爆发式增长,带动AIGC行业市场规模快速增长,年均复合增长率将超过70%,到2027年,中国AIGC市场规模将超过600亿元。2028年起,AIGC产业生态更加成熟,并在各行各业实现商业化落地应用,2030年,市场规模将超过万亿人民币。

GPT-4o

AI技术如火如荼,OpenAI前不久推出了GPT-4o多模态模型,相较于GPT-3.5大语言模型有了长足的进步。GPT-3.5主要处理文本输入,而我们看GPT-4o的官方介绍:
We’re announcing GPT-4o, our new flagship model that can reason across audio, vision, and text in real time.
我们宣布GPT-4o,我们的新旗舰模型,可以在音频,视觉和文本中进行实时推理。
这是多么伟大的进步,GPT-4o不仅理解文字,甚至能理解图片、音频和视频。

AIGC是什么?

AIGCArtificial Intelligence Generated Content,即AI生成内容的简写。

从某一天开始,我们突然发现,AI可以帮忙生成文字、图片、音频,视频等等内容了,而且让人难以分清背后的创作者到底是人类还是AI。这些AI生成的内容被叫做AIGC。 我们使用AI来生成与人类创作的内容相似甚至更高质量的内容。AI技术使得计算机能够理解、学习和模仿人类的创作过程。 AIGC不仅可以提高内容生产的效率,还能实现个性化和高质量的内容创作。

ChatGpt生成的文章,Github Copilot、通义灵码生成的代码,科大讯飞生成的音频,Midjourney、文心一言生成的图片,Sora生成的视频等等,都是AIGC

AIGC的应用

文本生成

ChatGpt文本生成

chatgpt

通义灵码代码生成

通义灵码

音频生成

科大讯飞音频生成

科大讯飞

图片生成

Midjourney图片生成不再支持账号免费试用,我们使用文心一言演示文本生成图片。

文心一言图片生成

文心一言

视频生成

Sora

落地场景

影视动漫、广告行业,教育领域等。

1. 影视动漫

未来,AIGC技术可能使得一个导演或创意总监就能完成整个影视、动漫或广告项目的制作。具体实现方式包括:

影视动漫

  • 剧本创作: AIGC模型可以根据导演的创意和要求生成剧本,包括对话、场景描述等。
  • 分镜头脚本: AIGC可以自动生成分镜头脚本,帮助导演规划每个镜头的拍摄角度、场景布置等。
  • 动画制作: 基于AIGC的动画生成工具可以自动创建角色动画、背景设计和特效处理,减少手动绘制的需求。
  • 视觉效果: AIGC可以用于生成复杂的视觉效果(VFX),如爆炸、天气变化等,减少人工特效制作的时间和成本。
  • 音效与音乐: AIGC可以生成背景音乐和音效,根据影片的情节和情感需要进行自动配乐。
  • 剪辑和后期处理: AIGC可以辅助或自动完成影片的剪辑和后期处理工作,提高效率和一致性。

2. 广告创作

广告创作

  • 广告文案: AIGC可以生成高质量的广告文案,涵盖各种风格和语调,以适应不同的品牌和市场需求。
  • 视觉设计: 自动生成广告视觉设计,包括平面设计、动画广告等,减少设计师的重复劳动。
  • 视频制作: 生成完整的广告视频,从脚本到拍摄再到剪辑,全面覆盖广告制作的各个环节。

3. 教育领域

AIGC可以扮演全能教授的角色,根据学生的个人需求和学习进度,制定个性化的学习计划,并提供多样化的学习资源。

教育领域

  • 个性化学习计划: 基于学生的兴趣、学习目标和当前水平,AIGC可以生成个性化的学习计划,推荐适合的学习资源和课程安排。
  • 自动评估与反馈: AIGC可以自动评估学生的学习成果,提供详细的反馈和改进建议,帮助学生不断提升。
  • 虚拟辅导: AIGC可以提供全天候的在线辅导,回答学生的问题,进行实时互动,模拟真人教授的辅导效果。
  • 内容生成: 自动生成教学材料、习题、测试和评估报告,减轻教师的负担。

AIGC的发展历程

内容的产生经历了 PGC -> UGC -> AIGC

1. PGC

PGC(Professional Generated Content) 定义: PGC指由专业人员或机构生成的内容。通常这些内容经过严格的策划、制作和审核,具有较高的质量和权威性。

2. UGC

UGC(User Generated Content) 定义: UGC指由普通用户生成的内容。任何人都可以通过互联网平台创建和分享内容,通常这些内容反映用户的个人观点和经验。

3. AIGC

AIGC(Intelligence Generated Content) 定义: AIGCAI生成内容。


AIGC发展的标志事件

早期萌芽阶段

  • 1950年,艾伦·图灵提出了著名的图灵测试:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。这一简化使得图灵能够令人信服地说明“思考的机器”是可能的。

沉淀积累阶段

  • 2007年,世界第一部完全由人工智能创作的小说《1 The Road》问世。
  • 2012年,微软公开展示了一个全自动同声传译系统,可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。

快速发展阶段

  • 2022年,OpenAI发布了GPT-3,用于生成自然语言文本。

发展历程

AIGC的原理

生成式AIAI机器学习监督学习无监督学习强化学习深度学习大语言模型等等词汇之间又是什么关系呢?有没有种剪不断理还乱的感觉?

直接看图

AI也叫人工智能,是计算机科学下的一个学科。机器学习是人工智能的子集,而深度学习又是机器学习的子集。

关系

机器学习

机器学习的核心在于不需要人类做显示编程,而是让计算机通过算法自行学习和改进去识别模式做出预测和决策。

  • 显示编程

    比如如果我们通过代码告诉计算机,图片里有红色说明是玫瑰,图片里有橙色说明是向日葵,那程序对花种类的判断就是通过人类直接明确编写逻辑达成的。不属于机器学习。机器什么都没学。

  • 机器学习

    如果我们给电脑大量玫瑰和向日葵的图片,让电脑自行识别模式总结规律从而能对没见过的图片进行预测和判断,这就是机器学习。

机器学习主要解决分类和回归问题:

分类问题输出的是物体所属的类别,回归问题输出的是物体的值。

  • 分类

    机器学习通过训练大量猫和狗的照片,用户输入一张狗的图片,计算机会判断这张图片是狗。这就是分类问题。

    分类

  • 回归

    机器学习通过训练大量商品房的价格,用户输入房子的面积、地段等信息,计算机会计算出房子的预估售价。这就是回归问题。

    回归

机器学习算法

  • 监督学习

    既给出数据特征本身,又给出数据属于的分类或者数值(答案)叫做监督学习。

    如下图,即给出了数字0-9的特征,又给出了数字属于的分类(答案),这就是监督学习。

    监督学习

  • 无监督学习

    只给出数据特征本身,不给出数据属于的分类或者数值(答案)叫做无监督学习。

    经典的无监督学习任务包括聚类,例如电商网上对用户购买数据分析,对用户进行聚类,一些用户只注重性价比,而另一些用户更注重于商品的质量。

  • 半监督学习

    一部分数据特征,给出了数据属于的分类或者数值(答案),另一部分数据特征没有给出数据属于的分类或者数值(答案),叫做半监督学习。

  • 强化学习

    让模型在环境里采取行动获得结果反馈,从反馈里学习从而能在给定情况下采取最佳行动来最大化奖励或是最小化损失。跟训海豚似的,刚开始的时候海豚会随心所欲做出很多动作,但随着和训师的互动,海豚会发现某些动作能够获得食物,某些动作没有食物,某些动作甚至会遭受惩罚。通过观察动作和奖惩之间的联系,海豚的行为会逐渐接近训师的期望。强化学习可以应用在很多任务上,比如说让模型下围棋,获得不同行动导致的奖励或损失反馈,从而在一局局游戏里优化策略学习如何采取行动达到高分。

深度学习

深度学习是机器学习的子集,它基于人工神经网络。 学习过程之所以是深度性的,是因为人工神经网络的结构由多个输入、输出和隐藏层构成。 每个层包含的单元可将输入数据转换为信息,供下一层用于特定的预测任务。 得益于这种结构,机器可以通过自身的数据处理进行学习。

生成式AI是深度学习的一种应用,可使用深度学习等技术生成新的内容。 例如,可以使用生成式 AI 创建图像、文本或音频。 这些模型利用大量预先训练的知识来生成此内容。