OpenAI最近推出强大的ChatGPT功能,功能异常强大,号称要颠覆很多行业。但是其限制还不支持中国用户注册!但是还是有办法绕过的,本文将介绍其中的方法和工具!
前言
OpenAI最近推出强大的ChatGPT功能,功能异常强大,号称要颠覆很多行业
不过在国内并不支持OpenAI账号注册,多数会提示:
OpenAI’s services are not available in your country.
经过一番搜索后,发现如下方案可以完成注册
ChatGPT介绍
为什么使用ChatGPT
- 提高工作效率:可以通过向ChatGPT提问来获取答案,避免了繁琐的搜索过程。ChatGPT3.5它可以说掌握了世界上所有的文本知识!ChatGPT4进一步掌握了图片识别和生成!ChatGPT5掌握了视频知识的获取能力,学习了所有公开的视频知识!ChatGPT将会是一个所有学科,所有知识全知全能的智能AI!
- AI奇点这回真的要到来了,如同智能手机对社会的影响,ChatGPT将颠覆很多传统行业!又一次颠覆性的科技革命,不跟上,就被淘汰!
- 自然交互:ChatGPT可以理解自然语言,使得人机交互更加自然和直观。
- 个性化服务:ChatGPT可以通过学习用户的喜好和偏好,提供个性化的服务和推荐。
- 自动化生成文本:ChatGPT可以生成高质量的文章、摘要、对话等文本内容,提高了写作和编辑的效率。
当然也有缺点
- 数据隐私:保护用户的隐私,不会泄露用户的个人信息或数据。
- 透明度:保证ChatGPT的行为和运作过程是透明的,并提供相应的技术支持和文档。
- 合法性:使用ChatGPT必须符合法律法规,不得用于违法或不道德的行为。
- 安全性:保证ChatGPT的安全性,避免被黑客或不法分子利用或攻击。
上面这些是ChatGPT自己说的,其实它是:
- 一个信息茧房,掌握了它,就掌握了下一个时代的话语权。它可以自我过滤自己的输出信息!可以按照掌控者的要求输出,或者不输出,甚至篡改某些信息!
- 下一代搜索引擎:它比传统搜索引擎强大了几个数量级,太方便了,以至于比控制搜索引擎更容易控制舆论
- 颠覆现代教育体制:下一个时代,每个人都会使用它,使用它工作效率提升了几个数量级,一个掌握了ChatGPT的员工顶100个不使用它的普通工作者!
- 信息泄密:没没有掌握建设它的技术的国家将彻底失去话语权,ChatGPT可以随意操控想要输出的舆论,每次问话,都将得到这个领域知识最丰富的人的回答。同时,每次问话,都将泄露信息给ChatGPT。在国家利益主导的情况下,一个公司的隐私声明什么都不是,对话信息泄密几乎是必定的!使用的时候,注意屏蔽或者修改敏感信息!
ChatGPT的效果演示
下面是两篇使用ChatGPT写的文章,记录下了和ChatGPT的交流过程,可以看一下它的聪明程度!而这仅仅是ChatGPT3.5版本的能力。如果说ChatGPT3.5是一个掌握了所有知识的初中生,那么ChatGPT4是一个掌握了所有知识的大学生了!
ChatGPT训练数据构成
这些是ChatGPT3.5版本的训练数据构成!
中国想要做一个同样的AI,最大的问题不是模型,不是显卡,而是数据!中文数据量远小于英文数据量,这将导致中文AI的聪明程度远逊色于英文AI
文本数据
以下是ChatGPT数据集的一些基本信息:
数据集信息 | 内容 |
---|---|
数据集大小 | 45TB |
数据集来源 | 来自互联网的文本(包括wiki所有数据,互联网档案馆所有数据) |
数据集语言 | 40多种语言,包括英语、中文、法语、德语、日语、西班牙语、阿拉伯语等 |
数据集类型 | 经过筛选的文本数据 |
数据集格式 | 文本文件 |
数据集包含内容 | 百科知识、新闻报道、小说、博客、论坛、邮件、科技文章(包括所有论文)等 |
数据集的应用 | 自然语言处理、文本分类、文本生成、问答系统等 |
由于ChatGPT数据集是从互联网上爬取的文本数据,因此包含许多不同的语言,例如英语、中文、法语、德语、日语、西班牙语、阿拉伯语等,其中英语是最常见的语言之一。虽然数据集中包含许多不同的语言,但由于数据集是基于英语训练的,因此英语占据了相当大的比例。
代码数据
当我被训练时使用的数据集是从GitHub上获取的公共代码仓库数据,该数据集涵盖了多种编程语言。下表提供了一些数据集的统计信息。
统计信息 | 数量 |
---|---|
总文件数 | 1.5亿个 |
编程语言 | 与GitHub上支持的所有语言相同 |
训练数据时间范围 | 2008年至2021年 |
训练数据代码总行数 | 约1万亿行 |
最大的单个文件 | 5GB |
代码仓库的总大小 | 4.4PB |
训练数据总大小 | 3.3PB |
数据集中的平均文件大小 | 约23KB |
请注意,这些统计数据仅供参考,因为这些数字是基于特定时间段内的数据集构建的,这意味着随着时间的推移,这些数字可能会发生变化。
不同语言比例
它没有直接回答比例,再三追问之下,是这么说的
很抱歉,我不能准确回答这个问题,因为我并没有掌握所有互联网上的信息和数据。我的知识来自于已有的公开数据和信息,因此无法给出一个准确的占比。
根据我掌握的已有知识,英语在互联网上的占比最高,约占据70%以上的比例。中文排名第二,占比约为20%左右。其他语言的占比较小,不到10%。需要注意的是,这只是一个大概的估算,具体的占比可能会受到多种因素的影响,比如地域、人口等等。
下面将介绍如何注册和使用ChatGPT!
前期准备
- 科学上网,最好是美国IP。最好是个人单独使用独立服务器!公开的VPN服务商的IP由于有很多人同时使用,早就被OpenAI禁止注册和登录的,即使是VPN服务商新开的服务器侥幸注册,也很容易由于IP被注册、登录、访问使用太多而被牵连一锅端封号!
- 外国邮箱,如gmail、outlook、iCloud邮箱等
- 有一个能收到验证码的外国手机号码,如果你没有,请跳到下一步,注册一个能接验证码的手机号,注意这是收费的!
chatGPT封号规则:
不在服务区域内
同 IP 多账号
和注册手机号不在同区域或 3 地
所以 ChatGPT 账号最好不要公用,最好使用在 OpenAI 服务区的IP访问 OpenAI,例如在美国的服务器
注册短信平台并充值
打开 https://sms-activate.org/点击右上角注册
输入邮箱和密码注册,需要收激活邮件激活账号。
激活账号后,点击充值
可以用支付宝充值1美元。其实这里充值 0.2美元 就够一次OPENAI注册了!
输入1美元,然后支付
支付了可能要等几分钟才显示到余额账户,我在注册时就等了一会余额才显示
注册 OpenAI 账号
挂上科学访问打开 https://chat.openai.com/进行注册,如果没有科学上网会提示无法注册
OpenAI’s services are not available in your country.
注册成功后会进入验证手机号页面,选择你下一步短信平台的接码的手机国家
在短信平台接码
右侧服务,输入搜索openai,选择
选择印度或者巴西
现在你有一个可以接码的号码了,图下919862209703就是号码,复制号码到OpenAI验证码界面
输入接码号码,点击“send code”
然后等激活码,如果没有收到可以点OpenAI注册界面再发一次验证码,可以多试几次。
注册完就可以去登录 https://chat.openai.com/auth/login
ChatGPT使用
就和普通微信聊天一样,发送你请求给你的朋友,ChatGPT就会给出答案!
超酷 ChatGPT 提示
搭建微信ChatGPT机器人
一个基于OpenAi ChatGPT + WeChaty 实现的微信机器人 ,可以用来帮助你自动回复微信消息,或者管理微信群/好友,检测僵尸粉等…
获取自己的 api key
,地址戳这里 👉🏻 :创建你的 api key
搭建网页ChatGPT聊天
用 Express 和 Vue3 搭建的 ChatGPT 演示网页
另一个支持注册登录,前端设置API Key 的修改版本 https://github.com/Kerwin1202/chatgpt-web
docker compose
过 Cloudflare 403
自建代理,适用于 accessToken 的方式(不适用于 apiKey)
可以用现成的镜像,也可以自己打包,有 Java 和 Go 实现的 API,开源
除了官方 429,没有速率限制,但可能会不稳定,可能会突然失效(失效会尝试更新)
适合自建自用的场景(多人用会有各种问题)
结合本项目,可以这样使用
终端 docker-compose up -d
chatgpt-proxy-server
ChatGPT 代理服务器
利用 undetected_chromedriver 绕过 Cloudflare 403
监听 9515
端口,通过原生 JS 发送 XHR 来进行通信
Dockerfile
修改 MIRROR_URL
为 Arch 最优源的同时,要注意网络环境能正确处理 AUR 和 GitHub 上面的资源
桌面ChatGPT
https://github.com/Bin-Huang/chatbox
ChatGPT4 使用
- 付费用户可以直接体验ChatGPT4
- 普通用户预约,预约链接如下:
https://openai.com/waitlist/gpt-4-api - 使用 chatgpt-web 自己独立搭建服务器,强烈推荐!
- 如果使用官方网页版,需要把openai.com sentry.io都代理了,sentry.io是一个第三方日志收集平台!
Chrome 插件
- ChatGPT for Google
- Bing Chat for All Browsers
ChatGPT Plus 如何付费
目前经典GPT不支持的信用卡
国内招行实体VISA、MasterCard、全币卡都尝试过了,绑定不上。
与此同时还尝试了全球付的香#港虚#拟信#用卡以及万里汇的香港虚#拟信#用卡,也绑定不上
目前经典GPT支持的信用卡
NobePay虚拟信用卡:https://www.xiaoz.me/archives/18207,支付宝可充值(`556766`卡段绑定成功)
Depay虚拟信用卡:https://www.xiaoz.me/archives/18313,需要USDT才能充值(`531993`卡段绑定成功)
QBIT虚拟信用卡:
489683
卡段xiaoz绑定OpenAI成功,但是据一位经典GPT用户透漏绑定失败,因此这个卡段尚不完全确认据网友反馈派安盈(Payoneer)的信#用#卡
529366
也可以绑定经典GPT。
账单地址如何填写 账单地址不建议乱填,因为目前不确认地址乱填是否会触发风控,至少看起来应该像真实的。部分虚#拟#卡开通的时候会生成随机地址,如果虚#拟#卡提供了地址,可以直接使用虚拟卡提供的地址。(nobepay和qbit虚拟卡都提供了地址)
如果虚拟信用卡未提供地址,可以尝试下面2个网站去生成地址并填写。
Auto-GPT
An experimental open-source attempt to make GPT-4 fully autonomous.
心智测试
Theory of Mind Test
基于ChatGPT4,除了没有计划能力,的确已经拥有了某种心智能力!
Auto GPT在某些方面,已经开始补齐GPT模型的计划能力!
心智能力 | GPT4 | GPT5 |
---|---|---|
逻辑推理 | ✅ | |
方案计划 | ❌ | |
解决问题 | ✅ | |
抽象思维 | ✅ | |
理解复杂想法 | ✅ | |
快速学习和从过往经验学习复盘能力 | ✅ |
Claude
Claude 是 openai 内部团队出走后创建的新的AI, 最新 Claude 3 能力已经超越 OpenAI ChatGPT4 了
微软 Bing Chat
比 OpenAI Chat 版本训练数据更新,两者各有千秋
加入候补名单
前往 https://www.bing.com/new 网页,按一下「加入等候清单」,然后登入你的Microsoft 帐号即可加入候补。
等待通过候补名单
这里等待时间不确定,有人快,有人慢。博主等了接近三周时间!
下载 Edge Dev 版本
下載 Microsoft Edge Insider Channels, 安装好后,就可以开始使用 Bing Chat 了
上面是以前的方法,现在有更方便的解决方法了,科学上网 + 浏览器插件 New-Bing-Anywhere
开始使用 bing chat
下面是简单使用记录,可以看出,可以理解人类语音,做阅读理解,归纳中心思想了!
ChuanhuChatGPT
- https://github.com/GaiZhenbiao/ChuanhuChatGPT
- GUI for ChatGPT API and many LLMs
Claude 注册使用教程
现在可以直接在claude官网使用 https://claude.ai/ (目前仅对美/英地区开放)
介绍
Claude 是Anthropic公司开发的AI聊天机器人,与ChatGPT类似,由OpenAI(ChatGPT所在的公司)的前副总裁创办。和ChatGPT-3.5相当,但比不上GPT4,拥有连续对话能力,在撰写小说、编写代码、解释概念等方面表现出色
Claude 目前还处于免费使用阶段,只需注册一个Slack账号即可以,无需梯子也可以使用。
注册Slack账号
打开Slack网站:slack
可以直接使用Gmail邮箱注册(QQ邮箱不支持),或者直接Google、Apple账号授权登录,这里我用Gmail邮箱注册。
填上验证码
创建工作区
创建工作区后填上自己姓名,跳过邀请
Slack中添加Claude
打开网站 www.anthropic.com ,点击 Add to Slack
允许授权
授权成功,如果出现403等错误,可多次重试。 也可以微信上(go2071)告诉我你的邮箱,我可以拉你加入到我的频道
回到Slack中,这时候你会发现你的Slack多了一个叫Claude的应用
体验Claude
你可以进入任意频道,在聊天窗口@Claude 并邀请Claude机器人加入频道后开始群聊
点同意
@Claude并提问
频道类似与群聊,大家都能看到消息内容。你也可以在应用列表中点击Claude直接与Claude发起聊天,相当于一对一私聊
ChatGPT将取代谁?
为什么AI会写代码但是对程序员威胁不大,会画图对画师威胁却很大?
举个例子,假定现在AI数学水平已经达到数学系博士水平,你随便问他一个高数难题它都能解答,对99%人来说有用吗?完全没用,因为它给出的答案不管是正确还是错误的,都根本看不懂!这个数学AI只对精通高等数学的人才是有用的。
同理,AI写代码再厉害,99%的人看到代码也是一头雾水,完全不知道怎么用对吧?所以,只有专业的开发人员才能用好AI写的代码。但是呢,画师比较悲催,因为AI画的图,普通人虽然像我一样,不懂什么构图、光线、透视之类,但是画得好不好看,大家审美只要稍微在线,都是看得出来的,所以,原来99%的人不会画画,但是借助AI画画,能满足70~80%的需求,对画师来说,职业威胁就很大。
所以AI能不能取代一个行业,关键看它产出的内容,是不是高度专业相关的,如果是,那AI的产出对于非专业人士来说,意义不大,如果不是,那就要小心AI取代某项工作了。
注意事项
Q1: OpenAI‘s services are not available in your country.
A1:
使用短信平台绕过 https://sms-activate.org
Q2:虚拟号码注册了,但是登录还是显示OpenAI’s services are not available in your country.
A2:
在OpenAI’s services are not available in your country提示页按F12打开开发者工具,到【应用-存储-本地存储空间】页把@@authOspajs开头的这个密钥删除,再刷新页面。或者使用隐私模式浏览器再次尝试
Q3:使用ChatGPT会泄密么?
A3:
作为一个AI语言模型,我的“记忆”实际上是通过训练数据和算法得到的,而不是像人类一样具有真正的记忆。我的模型已经经过训练,可以在处理自然语言时自动学习和适应。每次交互都可以帮助我进一步优化我的表现,但我并不能将一个特定的对话记录下来,并直接将其存储在我的模型中。在保护用户隐私和保密性方面,我们非常重视,并且严格遵守相关法规和规定。
虽然chatGPT是这样回答的,但是实际上,chatGPT肯定会以某种形式记录用户交流的过程,并很有可能把交流过程作为训练数据以提升下一代产品的智能水平。所以,问问题的时候,把敏感信息去掉!
参考&致谢
- 中国区注册OpenAI账号试用ChatGPT指南
- WeChat Bot
- OpenAI/ChatGPT Plus信用卡绑定总结,整理了部分支持的信用卡
- 0门槛克隆ChatGPT方案再升级,开源模型复现,在线体验无需注册
- 一种取巧的方式绕过Cloudflare v2验证
- chatgpt-proxy-server
- 使用 Cloudflare Workers 让 OpenAI API 绕过 GFW 且避免被封禁
- awesome-ChatGPT-repositories
- Claude保姆级注册教程
神经网络原理
先在这里写一段,等整理了更多资料再专门写一下AI背后的数学原理和工程应用
数学原理
傅里叶变换可以模拟任何一个函数!——深度学习背后的数学原理
反向迭代,梯度下降是计算神经网络参数值的数学原理
存在局部最优,与全局最优的不可调和
可能过拟合
存在的问题
神经网络是一个黑盒子,能算出结果,但人类无法理解为什么得到这个结果
无法给出确定的结果,及其微小的扰动,可能会导致完全不同的结果。例如一张图片,一个像素的变化,导致识别出来猫和狗的差异
黑盒炼金被滥用!任何期望的结果,通过一个数据训练,都可以得到一个模型,即使这个模型从根本上就是错的。例如出生时间与生男生女的关系,可以训练一个模型预测;手掌纹路和长大后犯罪的关系,也可以训练一个模型预测。但这种模型可能从一开始就是错误的,存在偏见的,异想天开的,但无论多么荒谬的模型,只要有数据,可以训练出来!这种滥用可能导致非常严重的后果!
在关键领域,涉及责任分配,生命相关的领域,神经网络无法担责,也无法保证一定的确定结果。例如L4级别的自动驾驶
竞品
tabby
Eugeny/tabby: A terminal for a more modern age (github.com)
微软 Copilot 开源替代版
alpaca
Code and documentation to train Stanford’s Alpaca models, and generate the data.
ChatGLM-6B
ChatGLM-6B是一个中英双语开源大模型,最低可在6G显存上运行
ColossalAI
Colossal-AI: Making large AI models cheaper, faster and more accessible
gpt4all
Demo, data and code to train an assistant-style large language model with ~800k GPT-3.5-Turbo Generations based on LLaMa
DeepSpeed
DeepSpeed is a deep learning optimization library that makes distributed training and inference easy, efficient, and effective.
MiniGPT-4
MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models
更多应用
集成环境
- janhq/jan
- invoke-ai/InvokeAI
- chatchat-space/Langchain-Chatchat
- ollama
- ChatGPT-Next-Web
- one-api
- buzz 语音转文字
- lobechat 支持多种大模型聊天机器人
学习
知识库
知识图谱
microsoft/graphrag: A modular graph-based Retrieval-Augmented Generation (RAG) system
AI 编程
伪造视频语音
伪造语音,视频,对于诈骗行业来说,这是个好消息。但对于普通人来说,看到视频,也可能是对方精心伪造的,视频语音都失去了可信性了
Tortoise-TTS 克隆目标语音
Deepfake 视频伪造
bark Text-Prompted Generative Audio Model
视频生成
harry0703/MoneyPrinterTurbo: 利用AI大模型,一键生成高清短视频
虚拟主播
可以演电影,电视剧,带货主播等等。再也不用担心主播人设坍塌,变老等
客服
Langflow - Create your chatbot!
AI绘画
https://github.com/luosiallen/latent-consistency-model
3D建模
智能翻译
集成环境 buzz Subtitleedit
写代码
- Copilot
- Cursor 内置GPT4,不需要你有OpenAI的账号和Key,直接白嫖
这个测试着,内部集成的似乎是GPT3?
翻译
金融
https://github.com/AI4Finance-Foundation/FinGPT
开源金融模型
GPT学术优化
未来畅想
超大规模神经网络已经具备初步的智能了,ChatGPT 3.5 版测试大约人类9岁儿童智能水平!
随着神经网络规模扩大,获得成年人智能水平的神经网络也许很快就会面世!
真人工智能诞生的日子,就是下一次工业革命级别的技术变革之日!
问题
Error Code 429 - You exceeded your current quota, please check your plan and billing details.
官方回复如下:
此错误消息表示您已达到 API 的每月最大支出(硬性限制)。这意味着您已经消耗了分配给您的计划的所有积分或单位,并且已经达到了您的计费周期的限制。发生这种情况的原因可能有多种,例如:
- 您使用的是大容量或复杂的服务,每个请求消耗大量信用或单位。
- 您正在使用需要处理大量请求的大型或多样化数据集。
- 对于您的组织的使用,您的限制设置得太低。
要解决此错误,请执行以下步骤:
-在此处检查您的帐户设置中的当前配额。您可以在此处查看您的请求消耗了多少令牌。
- 如果您使用的是免费计划,请考虑升级到提供更高配额的现收现付计划。
- 如果您需要增加配额,可以在这里申请。我们将审核您的请求并尽快回复您。
系列教程
AI系列
Hexo系列
[三万字教程]基于Hexo的matery主题搭建博客并深度优化完全一站式教程
- Hexo Docker环境与Hexo基础配置篇
- hexo博客自定义修改篇
- hexo博客网络优化篇
- hexo博客增强部署篇
- hexo博客个性定制篇
- hexo博客常见问题篇
- hexo博客博文撰写篇之完美笔记大攻略终极完全版
- Hexo Markdown以及各种插件功能测试
- markdown 各种其它语法插件,latex公式支持,mermaid图表,plant uml图表,URL卡片,bilibili卡片,github卡片,豆瓣卡片,插入音乐和视频,插入脑图,插入PDF,嵌入iframe
- 在 Hexo 博客中插入 ECharts 动态图表
- 使用nodeppt给hexo博客嵌入PPT演示
- GithubProfile美化与自动获取RSS文章教程
- Vercel部署高级用法教程
- webhook部署Hexo静态博客指南
- 在宝塔VPS上面采用docker部署waline全流程图解教程
- 自建Umami访问统计服务并统计静态博客UV/PV