Upload 9 files

Browse files

Files changed (10) hide show

.gitattributes +4 -0
internvl3_tokenizer.py +186 -0
main_api_ax650 +3 -0
main_api_axcl_x86 +3 -0
main_ax650 +3 -0
main_axcl_x86 +3 -0
run_internvl_3_2b_448_api_ax650.sh +10 -0
run_internvl_3_2b_448_api_axcl_x86.sh +11 -0
run_internvl_3_2b_448_ax650.sh +11 -0
run_internvl_3_2b_448_axcl_x86.sh +12 -0

.gitattributes CHANGED Viewed

@@ -38,3 +38,7 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.png filter=lfs diff=lfs merge=lfs -text
 *.mp4 filter=lfs diff=lfs merge=lfs -text
 examples/red-panda.mp4 filter=lfs diff=lfs merge=lfs -text

 *.png filter=lfs diff=lfs merge=lfs -text
 *.mp4 filter=lfs diff=lfs merge=lfs -text
 examples/red-panda.mp4 filter=lfs diff=lfs merge=lfs -text
+main_api_ax650 filter=lfs diff=lfs merge=lfs -text
+main_api_axcl_x86 filter=lfs diff=lfs merge=lfs -text
+main_ax650 filter=lfs diff=lfs merge=lfs -text
+main_axcl_x86 filter=lfs diff=lfs merge=lfs -text

internvl3_tokenizer.py ADDED Viewed

	@@ -0,0 +1,186 @@

+from transformers import AutoTokenizer
+from http.server import HTTPServer, BaseHTTPRequestHandler
+import json
+import argparse
+class Tokenizer_Http():
+    def __init__(self):
+        path = 'internvl3_2b_tokenizer'
+        self.tokenizer = AutoTokenizer.from_pretrained(path,
+                                                       trust_remote_code=True,
+                                                       use_fast=False)
+    def encode(self, content):
+        prompt = f"<|im_start|>system\n你是由上海人工智能实验室联合商汤科技开发的书生多模态大模型，英文名叫InternVL, 是一个有用无害的人工智能助手。<|im_end|><|im_start|>user\n{content}<|im_end|><|im_start|>assistant\n"
+        input_ids = self.tokenizer.encode(prompt)
+        return input_ids
+    def encode_with_image(self, question, num_of_images, imgsz) -> list:
+        prompt = "<|im_start|>system\n你是书生·万象, 英文名是InternVL, 是由上海人工智能实验室、清华大学及多家合作单位联合开发的多模态大语言模型.<|im_end|>\n"
+        prompt += "<|im_start|>user\n" + question
+        context_len = 64
+        if imgsz == 448:
+            context_len = 256
+        elif imgsz == 224:
+            context_len = 64
+        else:
+            print(f"imgsz is {imgsz}")
+            return
+        print("context_len is ", context_len)
+        if num_of_images > 0:
+            for idx in range(num_of_images):
+                prompt += "\n<img>" + "<IMG_CONTEXT>" * context_len + "</img>\n"
+        prompt += "<|im_end|>\n<|im_start|>assistant"
+        print(f"prompt is {prompt}")
+        token_ids = self.tokenizer.encode(prompt)
+        return token_ids
+    def decode(self, token_ids):
+        return self.tokenizer.decode(token_ids,
+                                     clean_up_tokenization_spaces=False, skip_special_tokens=True)
+    @property
+    def bos_id(self):
+        return self.tokenizer.bos_token_id
+    @property
+    def eos_id(self):
+        return self.tokenizer.eos_token_id
+    @property
+    def bos_token(self):
+        return self.tokenizer.bos_token
+    @property
+    def eos_token(self):
+        return self.tokenizer.eos_token
+    @property
+    def img_start_token(self):
+        return self.tokenizer.encode("<img>")[0]
+    @property
+    def img_context_token(self):
+        return self.tokenizer.encode("<IMG_CONTEXT>")[0]
+tokenizer = Tokenizer_Http()
+print(tokenizer.bos_id, tokenizer.bos_token, tokenizer.eos_id,
+      tokenizer.eos_token, tokenizer.img_start_token, tokenizer.img_context_token)
+token_ids = tokenizer.encode_with_image("你好", 1, 448)
+print(token_ids)
+print(len(token_ids))
+token_ids = tokenizer.encode("hello world")
+print(token_ids)
+print(len(token_ids))
+class Request(BaseHTTPRequestHandler):
+    #通过类继承，新定义类
+    timeout = 5
+    server_version = 'Apache'
+    def do_GET(self):
+        print(self.path)
+        #在新类中定义get的内容（当客户端向该服务端使用get请求时，本服务端将如下运行）
+        self.send_response(200)
+        self.send_header("type", "get")  #设置响应头，可省略或设置多个
+        self.end_headers()
+        if self.path == '/bos_id':
+            bos_id = tokenizer.bos_id
+            # print(bos_id)
+            # to json
+            if bos_id is None:
+                msg = json.dumps({'bos_id': -1})
+            else:
+                msg = json.dumps({'bos_id': bos_id})
+        elif self.path == '/eos_id':
+            eos_id = tokenizer.eos_id
+            if eos_id is None:
+                msg = json.dumps({'eos_id': -1})
+            else:
+                msg = json.dumps({'eos_id': eos_id})
+        elif self.path == '/img_start_token':
+            img_start_token = tokenizer.img_start_token
+            if img_start_token is None:
+                msg = json.dumps({'img_start_token': -1})
+            else:
+                msg = json.dumps({'img_start_token': img_start_token})
+        elif self.path == '/img_context_token':
+            img_context_token = tokenizer.img_context_token
+            if img_context_token is None:
+                msg = json.dumps({'img_context_token': -1})
+            else:
+                msg = json.dumps({'img_context_token': img_context_token})
+        else:
+            msg = 'error'
+        print(msg)
+        msg = str(msg).encode()  #转为str再转为byte格式
+        self.wfile.write(msg)  #将byte格式的信息返回给客户端
+    def do_POST(self):
+        #在新类中定义post的内容（当客户端向该服务端使用post请求时，本服务端将如下运行）
+        data = self.rfile.read(int(
+            self.headers['content-length']))  #获取从客户端传入的参数（byte格式）
+        data = data.decode()  #将byte格式转为str格式
+        self.send_response(200)
+        self.send_header("type", "post")  #设置响应头，��省略或设置多个
+        self.end_headers()
+        if self.path == '/encode':
+            req = json.loads(data)
+            print(req)
+            prompt = req['text']
+            b_img_prompt = False
+            if 'img_prompt' in req:
+                b_img_prompt = req['img_prompt']
+            if b_img_prompt:
+                num_img = req['num_img']
+                imgsz = req['imgsz']
+                token_ids = tokenizer.encode_with_image(prompt, num_img, imgsz)
+            else:
+                token_ids = tokenizer.encode(prompt)
+            if token_ids is None:
+                msg = json.dumps({'token_ids': -1})
+            else:
+                msg = json.dumps({'token_ids': token_ids})
+        elif self.path == '/decode':
+            req = json.loads(data)
+            token_ids = req['token_ids']
+            text = tokenizer.decode(token_ids)
+            if text is None:
+                msg = json.dumps({'text': ""})
+            else:
+                msg = json.dumps({'text': text})
+        else:
+            msg = 'error'
+        print(msg)
+        msg = str(msg).encode()  #转为str再转为byte格式
+        self.wfile.write(msg)  #将byte格式的信息返回给客户端
+if __name__ == "__main__":
+    args = argparse.ArgumentParser()
+    args.add_argument('--host', type=str, default='0.0.0.0')
+    args.add_argument('--port', type=int, default=12345)
+    args = args.parse_args()
+    host = (args.host, args.port)  #设定地址与端口号，'localhost'等价于'127.0.0.1'
+    print('http://%s:%s' % host)
+    server = HTTPServer(host, Request)  #根据地址端口号和新定义的类，创建服务器实例
+    server.serve_forever()  #开启服务

main_api_ax650 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9fc74b9dcf37c2b75d1894fa0f0ecaffe741b11f13a58dda0d30ff1b4ca8d508
+size 6667616

main_api_axcl_x86 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:849231c5e30faa54cf62a55022a45b42ed767a7feb52ea26483e5c70eb9073dd
+size 1927840

main_ax650 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2b0bc06d4c78f592ae546a9f91f260dd62da7bf6b41a8f8a24a7a648d58c7f72
+size 6568824

main_axcl_x86 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:273bac369315774e6e6df5e725647c49e5356f22cc512f1daadfd58066a37ef0
+size 1840560

run_internvl_3_2b_448_api_ax650.sh ADDED Viewed

	@@ -0,0 +1,10 @@

+./main_api_ax650 \
+--template_filename_axmodel "./internvl3_2b_axmodel/qwen2_p128_l%d_together.axmodel" \
+--axmodel_num 28 \
+--filename_image_encoder_axmodedl "./vit_axmodel/internvl3_2b_vit_slim.axmodel" \
+--use_mmap_load_embed 1 \
+--filename_tokenizer_model "http://0.0.0.0:12345" \
+--filename_post_axmodel "./internvl3_2b_axmodel/qwen2_post.axmodel" \
+--filename_tokens_embed "./internvl3_2b_axmodel/model.embed_tokens.weight.bf16.bin" \
+--tokens_embed_num 151674 \
+--tokens_embed_size 1536

run_internvl_3_2b_448_api_axcl_x86.sh ADDED Viewed

	@@ -0,0 +1,11 @@

+./main_api_axcl_x86 \
+--template_filename_axmodel "./internvl3_2b_axmodel/qwen2_p128_l%d_together.axmodel" \
+--axmodel_num 28 \
+--filename_image_encoder_axmodedl "./vit_axmodel/internvl3_2b_vit_slim.axmodel" \
+--use_mmap_load_embed 1 \
+--filename_tokenizer_model "http://0.0.0.0:12345" \
+--filename_post_axmodel "./internvl3_2b_axmodel/qwen2_post.axmodel" \
+--filename_tokens_embed "./internvl3_2b_axmodel/model.embed_tokens.weight.bf16.bin" \
+--tokens_embed_num 151674 \
+--tokens_embed_size 1536 \
+--devices 0,2,4 \

run_internvl_3_2b_448_ax650.sh ADDED Viewed

	@@ -0,0 +1,11 @@

+./main_ax650 \
+--template_filename_axmodel "./internvl3_2b_axmodel/qwen2_p128_l%d_together.axmodel" \
+--axmodel_num 28 \
+--filename_image_encoder_axmodedl "./vit_axmodel/internvl3_2b_vit_slim.axmodel" \
+--use_mmap_load_embed 1 \
+--filename_tokenizer_model "http://0.0.0.0:12345" \
+--filename_post_axmodel "./internvl3_2b_axmodel/qwen2_post.axmodel" \
+--filename_tokens_embed "./internvl3_2b_axmodel/model.embed_tokens.weight.bf16.bin" \
+--tokens_embed_num 151674 \
+--tokens_embed_size 1536 \
+--live_print 1

run_internvl_3_2b_448_axcl_x86.sh ADDED Viewed

	@@ -0,0 +1,12 @@

+./main_axcl_x86 \
+--template_filename_axmodel "./internvl3_2b_axmodel/qwen2_p128_l%d_together.axmodel" \
+--axmodel_num 28 \
+--filename_image_encoder_axmodedl "./vit_axmodel/internvl3_2b_vit_slim.axmodel" \
+--use_mmap_load_embed 1 \
+--filename_tokenizer_model "http://0.0.0.0:12345" \
+--filename_post_axmodel "./internvl3_2b_axmodel/qwen2_post.axmodel" \
+--filename_tokens_embed "./internvl3_2b_axmodel/model.embed_tokens.weight.bf16.bin" \
+--tokens_embed_num 151674 \
+--tokens_embed_size 1536 \
+--devices 0,2,4 \
+--live_print 1