Python酷玩之旅_aigc文生图模型入门(通义万相)

导览

  • 前言
  • 一、申请key
  • 二、安装sdk
  • 三、选择模型
  • 1. 文生图
  • 2. 应用场景
  • 2.1 艺术与设计创作
  • 2.2 广告与营销物料生成
  • 2.3 教育与培训资源制作
  • 2.4 新闻与媒体内容生产
  • 2.5 游戏与娱乐内容开发
  • 2.6 室内设计与家居装饰
  • 2.7 时尚与服装设计
  • 2.8 图书封面与插图生成
  • 四、示例
  • 1. 源码
  • 2. 运行结果
  • 结语
  • 系列回顾
  • 前言

    博主最近一直使用阿里的文生图模型(通义万相),生成一些图片。这个模型的用途,可通过阿里云官网的模型服务(MaaS),略窥一二:

    通义万相-文本生成图像是基于自研的Composer组合生成框架的AI绘画创作大模型,能够根据用户输入的文字内容,生成符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加速收敛并提升最终生成。

    如果你感兴趣,可直接通过官网(快捷方式)查看相关内容。

    接下来,我们直接快速的切入本文主题吧。

    一、申请key

    请参考博主的另外一篇文章基于Python的大模型学习手册(入门级)中的2.1.1节完成,这里不再赘述。

    提示:key是请求模型的唯一的凭证,需要妥善保管,不能暴露在公网或者其他公共场合。

    二、安装sdk

    安装sdk也比较简单,输入:

    pip3 install dashscope
    

    执行完成后,可以通过Pycharm——>Python Packages查看是否已存在:

    如上图,代表成功。

    三、选择模型

    1. 文生图

    本次选择的模型是wanx-v1。参数要求如下:

    2. 应用场景

    它的应用场景,可通过官方帮助文档获得。博主直接进行罗列,不再转述。

    2.1 艺术与设计创作

    设计师和创意工作者快速生成概念草图、插画、海报、包装设计、甚至数字艺术品,极大地缩短了构思到成品的时间,降低了创作门槛,文生图技术提供了无限的灵感源泉和高效的原型生成工具。

    2.2 广告与营销物料生成

    文生图能够即时响应广告文案,生成符合品牌调性、产品特性和营销策略的视觉内容,节省了传统拍摄与后期制作的成本,广告内容根据实时热点迅速调整,实现高度定制化和敏捷营销。

    2.3 教育与培训资源制作

    教育工作者和培训师利用文生图模型来创建生动、直观的教学素材,有助于提升教学内容的吸引力和理解度,定制化的图像资源还能用于制作互动课件、电子教科书,丰富教育资源库。

    2.4 新闻与媒体内容生产

    新闻机构和内容平台采用文生图技术来增强报道的视觉呈现,即时生成的视觉内容不仅能吸引读者注意力,提高阅读体验,还能确保新闻报道的时效性和准确性。

    2.5 游戏与娱乐内容开发

    游戏开发者借助文生图大模型来快速生成游戏内的角色、道具、环境元素等美术资源,用于动态生成游戏NPC(非玩家角色)外观或定制化的玩家角色,增加游戏世界的多样性和沉浸感。

    2.6 室内设计与家居装饰

    室内设计师和家居平台利用文生图模型为客户提供虚拟设计方案,可生成相应的空间布局、色彩搭配及装饰细节的三维视图或渲染图,便于设计师快速迭代修改。

    2.7 时尚与服装设计

    时尚设计师和电商平台利用文生图技术进行服装设计和虚拟试穿体验。电商平台则可以结合用户身材数据,让用户输入文字描述想要的服装款式或风格,生成个性化虚拟试穿图片。

    2.8 图书封面与插图生成

    出版社和独立作者利用文生图模型自动生成与书籍主题契合的封面设计和内页插图,模型将创作出引人入胜的封面图像,自动化地为用户提供定制封面选项,简化流程。

    四、示例

    1. 源码

    示例比较简单,博主直接搬运官网的代码,简单备注,可以直接运行:

    from http import HTTPStatus
    from urllib.parse import urlparse, unquote
    from pathlib import PurePosixPath
    import requests
    import dashscope
    from dashscope import ImageSynthesis
    
    # 填写dashscope key
    dashscope.api_key = "你的模型key"
    
    def simple_call():
    
        # 文本提示
        prompt = '画一张大数据平台技术架构图'
    
        ''' 调用模型并设置入参
            model: 模型名称
            n:数量
            size:图片尺寸
        '''
        rsp = ImageSynthesis.call(model=ImageSynthesis.Models.wanx_v1,
                                  prompt=prompt,
                                  n=4,
                                  size='1024*1024')
    
        # 响应ok
        if rsp.status_code == HTTPStatus.OK:
            # 遍历结果
            for result in rsp.output.results:
                file_name = PurePosixPath(unquote(urlparse(result.url).path)).parts[-1]
                # 保存图片
                with open('./%s' % file_name, 'wb+') as f:
                    f.write(requests.get(result.url).content)
        else:
            print('Failed, status_code: %s, code: %s, message: %s' %
                  (rsp.status_code, rsp.code, rsp.message))
    
    
    if __name__ == '__main__':
        simple_call()
    

    2. 运行结果





    看到这4张图,博主感到有点“眩晕”

    结语

    本文通过一个简单的案例(基于阿里云通义万相)介绍了文生图模型的一般用法,希望对有兴趣的盆友有所启发。

    系列回顾

    Python酷玩之旅_数据分析入门(matplotlib)
    Python酷玩之旅_如何正确使用pipreqs完成依赖导出(解决UnicodeDecodeError)
    Python酷玩之旅_如何在Centos8顺利安装Python最新版(3.12)
    Python酷玩之旅_如何连接MySQL(mysql-connector-python)


    作者:一叶飞舟

    物联沃分享整理
    物联沃-IOTWORD物联网 » Python酷玩之旅_aigc文生图模型入门(通义万相)

    发表回复