text-generation-webui/extensions/openai/script.py

import json
import os
from threading import Thread

import extensions.openai.completions as OAIcompletions
import extensions.openai.embeddings as OAIembeddings
import extensions.openai.images as OAIimages
import extensions.openai.models as OAImodels
import extensions.openai.moderations as OAImoderations
import speech_recognition as sr
import uvicorn
from extensions.openai.errors import ServiceUnavailableError
from extensions.openai.tokens import token_count, token_decode, token_encode
from extensions.openai.utils import _start_cloudflared
from fastapi import Depends, FastAPI, Header, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from fastapi.requests import Request
from fastapi.responses import JSONResponse
from modules import shared
from modules.logging_colors import logger
from modules.text_generation import stop_everything_event
from pydub import AudioSegment
from sse_starlette import EventSourceResponse

from .typing import (
    ChatCompletionRequest,
    ChatCompletionResponse,
    CompletionRequest,
    CompletionResponse,
    DecodeRequest,
    DecodeResponse,
    EncodeRequest,
    EncodeResponse,
    ModelInfoResponse,
    TokenCountResponse,
    to_dict
)

params = {
    'embedding_device': 'cpu',
    'embedding_model': 'all-mpnet-base-v2',
    'sd_webui_url': '',
    'debug': 0
}


def verify_api_key(authorization: str = Header(None)) -> None:
    expected_api_key = shared.args.api_key
    if expected_api_key and (authorization is None or authorization != f"Bearer {expected_api_key}"):
        raise HTTPException(status_code=401, detail="Unauthorized")


app = FastAPI(dependencies=[Depends(verify_api_key)])

# Configure CORS settings to allow all origins, methods, and headers
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["GET", "HEAD", "OPTIONS", "POST", "PUT"],
    allow_headers=[
        "Origin",
        "Accept",
        "X-Requested-With",
        "Content-Type",
        "Access-Control-Request-Method",
        "Access-Control-Request-Headers",
        "Authorization",
    ],
)


@app.options("/")
async def options_route():
    return JSONResponse(content="OK")


@app.post('/v1/completions', response_model=CompletionResponse)
async def openai_completions(request: Request, request_data: CompletionRequest):
    path = request.url.path
    is_legacy = "/generate" in path

    if request_data.stream:
        async def generator():
            response = OAIcompletions.stream_completions(to_dict(request_data), is_legacy=is_legacy)
            for resp in response:
                yield {"data": json.dumps(resp)}

        return EventSourceResponse(generator())  # SSE streaming

    else:
        response = OAIcompletions.completions(to_dict(request_data), is_legacy=is_legacy)
        return JSONResponse(response)


@app.post('/v1/chat/completions', response_model=ChatCompletionResponse)
async def openai_chat_completions(request: Request, request_data: ChatCompletionRequest):
    path = request.url.path
    is_legacy = "/generate" in path

    if request_data.stream:
        async def generator():
            response = OAIcompletions.stream_chat_completions(to_dict(request_data), is_legacy=is_legacy)
            for resp in response:
                yield {"data": json.dumps(resp)}

        return EventSourceResponse(generator())  # SSE streaming

    else:
        response = OAIcompletions.chat_completions(to_dict(request_data), is_legacy=is_legacy)
        return JSONResponse(response)


@app.get("/v1/models")
@app.get("/v1/models/{model}")
async def handle_models(request: Request):
    path = request.url.path
    is_list = request.url.path.split('?')[0].split('#')[0] == '/v1/models'

    if is_list:
        response = OAImodels.list_models()
    else:
        model_name = path[len('/v1/models/'):]
        response = OAImodels.model_info_dict(model_name)

    return JSONResponse(response)


@app.get('/v1/billing/usage')
def handle_billing_usage():
    '''
    Ex. /v1/dashboard/billing/usage?start_date=2023-05-01&end_date=2023-05-31
    '''
    return JSONResponse(content={"total_usage": 0})


@app.post('/v1/audio/transcriptions')
async def handle_audio_transcription(request: Request):
    r = sr.Recognizer()

    form = await request.form()
    audio_file = await form["file"].read()
    audio_data = AudioSegment.from_file(audio_file)

    # Convert AudioSegment to raw data
    raw_data = audio_data.raw_data

    # Create AudioData object
    audio_data = sr.AudioData(raw_data, audio_data.frame_rate, audio_data.sample_width)
    whipser_language = form.getvalue('language', None)
    whipser_model = form.getvalue('model', 'tiny')  # Use the model from the form data if it exists, otherwise default to tiny

    transcription = {"text": ""}

    try:
        transcription["text"] = r.recognize_whisper(audio_data, language=whipser_language, model=whipser_model)
    except sr.UnknownValueError:
        print("Whisper could not understand audio")
        transcription["text"] = "Whisper could not understand audio UnknownValueError"
    except sr.RequestError as e:
        print("Could not request results from Whisper", e)
        transcription["text"] = "Whisper could not understand audio RequestError"

    return JSONResponse(content=transcription)


@app.post('/v1/images/generations')
async def handle_image_generation(request: Request):

    if not os.environ.get('SD_WEBUI_URL', params.get('sd_webui_url', '')):
        raise ServiceUnavailableError("Stable Diffusion not available. SD_WEBUI_URL not set.")

    body = await request.json()
    prompt = body['prompt']
    size = body.get('size', '1024x1024')
    response_format = body.get('response_format', 'url')  # or b64_json
    n = body.get('n', 1)  # ignore the batch limits of max 10

    response = await OAIimages.generations(prompt=prompt, size=size, response_format=response_format, n=n)
    return JSONResponse(response)


@app.post("/v1/embeddings")
async def handle_embeddings(request: Request):
    body = await request.json()
    encoding_format = body.get("encoding_format", "")

    input = body.get('input', body.get('text', ''))
    if not input:
        raise HTTPException(status_code=400, detail="Missing required argument input")

    if type(input) is str:
        input = [input]

    response = OAIembeddings.embeddings(input, encoding_format)
    return JSONResponse(response)


@app.post("/v1/moderations")
async def handle_moderations(request: Request):
    body = await request.json()
    input = body["input"]
    if not input:
        raise HTTPException(status_code=400, detail="Missing required argument input")

    response = OAImoderations.moderations(input)
    return JSONResponse(response)


@app.post("/v1/internal/encode", response_model=EncodeResponse)
async def handle_token_encode(request_data: EncodeRequest):
    response = token_encode(request_data.text)
    return JSONResponse(response)


@app.post("/v1/internal/decode", response_model=DecodeResponse)
async def handle_token_decode(request_data: DecodeRequest):
    response = token_decode(request_data.tokens)
    return JSONResponse(response)


@app.post("/v1/internal/token-count", response_model=TokenCountResponse)
async def handle_token_count(request_data: EncodeRequest):
    response = token_count(request_data.text)
    return JSONResponse(response)


@app.post("/v1/internal/stop-generation")
async def handle_stop_generation(request: Request):
    stop_everything_event()
    return JSONResponse(content="OK")


@app.get("/v1/internal/model-info", response_model=ModelInfoResponse)
async def handle_model_info():
    payload = OAImodels.get_current_model_info()
    return JSONResponse(content=payload)


def run_server():
    server_addr = '0.0.0.0' if shared.args.listen else '127.0.0.1'
    port = int(os.environ.get('OPENEDAI_PORT', shared.args.api_port))

    ssl_certfile = os.environ.get('OPENEDAI_CERT_PATH', shared.args.ssl_certfile)
    ssl_keyfile = os.environ.get('OPENEDAI_KEY_PATH', shared.args.ssl_keyfile)

    if shared.args.public_api:
        def on_start(public_url: str):
            logger.info(f'OpenAI compatible API URL:\n\n{public_url}/v1\n')

        _start_cloudflared(port, shared.args.public_api_id, max_attempts=3, on_start=on_start)
    else:
        if ssl_keyfile and ssl_certfile:
            logger.info(f'OpenAI compatible API URL:\n\nhttps://{server_addr}:{port}/v1\n')
        else:
            logger.info(f'OpenAI compatible API URL:\n\nhttp://{server_addr}:{port}/v1\n')

    if shared.args.api_key:
        logger.info(f'OpenAI API key:\n\n{shared.args.api_key}\n')

    uvicorn.run(app, host=server_addr, port=port, ssl_certfile=ssl_certfile, ssl_keyfile=ssl_keyfile)


def setup():
    Thread(target=run_server, daemon=True).start()
Style/pep8 improvements 2023-05-03 04:05:38 +02:00			`import json`
			`import os`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00			`from threading import Thread`
Style improvements (#1957) 2023-05-10 03:49:39 +02:00
Lint the openai extension 2023-09-16 05:11:16 +02:00			`import extensions.openai.completions as OAIcompletions`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00			`import extensions.openai.embeddings as OAIembeddings`
			`import extensions.openai.images as OAIimages`
Lint the openai extension 2023-09-16 05:11:16 +02:00			`import extensions.openai.models as OAImodels`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00			`import extensions.openai.moderations as OAImoderations`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`import speech_recognition as sr`
			`import uvicorn`
			`from extensions.openai.errors import ServiceUnavailableError`
Lint the openai extension 2023-09-16 05:11:16 +02:00			`from extensions.openai.tokens import token_count, token_decode, token_encode`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`from extensions.openai.utils import _start_cloudflared`
			`from fastapi import Depends, FastAPI, Header, HTTPException`
			`from fastapi.middleware.cors import CORSMiddleware`
			`from fastapi.requests import Request`
			`from fastapi.responses import JSONResponse`
Lint the openai extension 2023-09-16 05:11:16 +02:00			`from modules import shared`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`from modules.logging_colors import logger`
Add /v1/internal/stop-generation to OpenAI API (#4498) 2023-11-07 04:10:42 +01:00			`from modules.text_generation import stop_everything_event`
add whisper api to openai plugin (#3958) 2023-09-16 17:04:04 +02:00			`from pydub import AudioSegment`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`from sse_starlette import EventSourceResponse`

			`from .typing import (`
			`ChatCompletionRequest,`
			`ChatCompletionResponse,`
			`CompletionRequest,`
			`CompletionResponse,`
Add types to the encode/decode/token-count endpoints 2023-11-08 04:05:36 +01:00			`DecodeRequest,`
			`DecodeResponse,`
			`EncodeRequest,`
			`EncodeResponse,`
Add /v1/internal/model-info endpoint 2023-11-08 03:59:02 +01:00			`ModelInfoResponse,`
Add types to the encode/decode/token-count endpoints 2023-11-08 04:05:36 +01:00			`TokenCountResponse,`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`to_dict`
			`)`
add whisper api to openai plugin (#3958) 2023-09-16 17:04:04 +02:00
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00			`params = {`
extensions/openai: load extension settings via settings.yaml (#3953) 2023-09-18 03:39:29 +02:00			`'embedding_device': 'cpu',`
			`'embedding_model': 'all-mpnet-base-v2',`
			`'sd_webui_url': '',`
			`'debug': 0`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00			`}`

[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`def verify_api_key(authorization: str = Header(None)) -> None:`
			`expected_api_key = shared.args.api_key`
			`if expected_api_key and (authorization is None or authorization != f"Bearer {expected_api_key}"):`
			`raise HTTPException(status_code=401, detail="Unauthorized")`


			`app = FastAPI(dependencies=[Depends(verify_api_key)])`

			`# Configure CORS settings to allow all origins, methods, and headers`
			`app.add_middleware(`
			`CORSMiddleware,`
			`allow_origins=["*"],`
			`allow_credentials=True,`
			`allow_methods=["GET", "HEAD", "OPTIONS", "POST", "PUT"],`
			`allow_headers=[`
			`"Origin",`
			`"Accept",`
			`"X-Requested-With",`
			`"Content-Type",`
			`"Access-Control-Request-Method",`
			`"Access-Control-Request-Headers",`
			`"Authorization",`
			`],`
			`)`


			`@app.options("/")`
			`async def options_route():`
			`return JSONResponse(content="OK")`

[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 16:06:39 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.post('/v1/completions', response_model=CompletionResponse)`
			`async def openai_completions(request: Request, request_data: CompletionRequest):`
			`path = request.url.path`
			`is_legacy = "/generate" in path`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`if request_data.stream:`
			`async def generator():`
			`response = OAIcompletions.stream_completions(to_dict(request_data), is_legacy=is_legacy)`
			`for resp in response:`
			`yield {"data": json.dumps(resp)}`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`return EventSourceResponse(generator()) # SSE streaming`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`else:`
			`response = OAIcompletions.completions(to_dict(request_data), is_legacy=is_legacy)`
			`return JSONResponse(response)`


			`@app.post('/v1/chat/completions', response_model=ChatCompletionResponse)`
			`async def openai_chat_completions(request: Request, request_data: ChatCompletionRequest):`
			`path = request.url.path`
			`is_legacy = "/generate" in path`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`if request_data.stream:`
			`async def generator():`
			`response = OAIcompletions.stream_chat_completions(to_dict(request_data), is_legacy=is_legacy)`
			`for resp in response:`
			`yield {"data": json.dumps(resp)}`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`return EventSourceResponse(generator()) # SSE streaming`
lint 2023-07-12 20:33:25 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`else:`
			`response = OAIcompletions.chat_completions(to_dict(request_data), is_legacy=is_legacy)`
			`return JSONResponse(response)`


			`@app.get("/v1/models")`
Refactor the /v1/models endpoint 2023-11-08 04:59:27 +01:00			`@app.get("/v1/models/{model}")`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`async def handle_models(request: Request):`
			`path = request.url.path`
Refactor the /v1/models endpoint 2023-11-08 04:59:27 +01:00			`is_list = request.url.path.split('?')[0].split('#')[0] == '/v1/models'`

			`if is_list:`
			`response = OAImodels.list_models()`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`else:`
			`model_name = path[len('/v1/models/'):]`
Refactor the /v1/models endpoint 2023-11-08 04:59:27 +01:00			`response = OAImodels.model_info_dict(model_name)`
Style/pep8 improvements 2023-05-03 04:05:38 +02:00
Refactor the /v1/models endpoint 2023-11-08 04:59:27 +01:00			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00

Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.get('/v1/billing/usage')`
			`def handle_billing_usage():`
			`'''`
			`Ex. /v1/dashboard/billing/usage?start_date=2023-05-01&end_date=2023-05-31`
			`'''`
			`return JSONResponse(content={"total_usage": 0})`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.post('/v1/audio/transcriptions')`
			`async def handle_audio_transcription(request: Request):`
			`r = sr.Recognizer()`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`form = await request.form()`
			`audio_file = await form["file"].read()`
			`audio_data = AudioSegment.from_file(audio_file)`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 16:06:39 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`# Convert AudioSegment to raw data`
			`raw_data = audio_data.raw_data`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 16:06:39 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`# Create AudioData object`
			`audio_data = sr.AudioData(raw_data, audio_data.frame_rate, audio_data.sample_width)`
			`whipser_language = form.getvalue('language', None)`
			`whipser_model = form.getvalue('model', 'tiny') # Use the model from the form data if it exists, otherwise default to tiny`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 16:06:39 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`transcription = {"text": ""}`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`try:`
			`transcription["text"] = r.recognize_whisper(audio_data, language=whipser_language, model=whipser_model)`
			`except sr.UnknownValueError:`
			`print("Whisper could not understand audio")`
			`transcription["text"] = "Whisper could not understand audio UnknownValueError"`
			`except sr.RequestError as e:`
			`print("Could not request results from Whisper", e)`
			`transcription["text"] = "Whisper could not understand audio RequestError"`
extensions/openai: Fixes for: embeddings, tokens, better errors. +Docs update, +Images, +logit_bias/logprobs, +more. (#3122) 2023-07-24 16:28:12 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`return JSONResponse(content=transcription)`
[extension/openai] add edits & image endpoints & fix prompt return in non --chat modes (#1935) 2023-05-11 16:06:39 +02:00

Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.post('/v1/images/generations')`
			`async def handle_image_generation(request: Request):`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`if not os.environ.get('SD_WEBUI_URL', params.get('sd_webui_url', '')):`
			`raise ServiceUnavailableError("Stable Diffusion not available. SD_WEBUI_URL not set.")`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`body = await request.json()`
			`prompt = body['prompt']`
			`size = body.get('size', '1024x1024')`
			`response_format = body.get('response_format', 'url') # or b64_json`
			`n = body.get('n', 1) # ignore the batch limits of max 10`
lint 2023-07-12 20:33:25 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`response = await OAIimages.generations(prompt=prompt, size=size, response_format=response_format, n=n)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00

Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.post("/v1/embeddings")`
			`async def handle_embeddings(request: Request):`
			`body = await request.json()`
			`encoding_format = body.get("encoding_format", "")`
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`input = body.get('input', body.get('text', ''))`
			`if not input:`
			`raise HTTPException(status_code=400, detail="Missing required argument input")`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`if type(input) is str:`
			`input = [input]`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`response = OAIembeddings.embeddings(input, encoding_format)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00
lint 2023-07-12 20:33:25 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`@app.post("/v1/moderations")`
			`async def handle_moderations(request: Request):`
			`body = await request.json()`
			`input = body["input"]`
			`if not input:`
			`raise HTTPException(status_code=400, detail="Missing required argument input")`
extensions/openai: Major openai extension updates & fixes (#3049) * many openai updates * total reorg & cleanup. * fixups * missing import os for images * +moderations, custom_stopping_strings, more fixes * fix bugs in completion streaming * moderation fix (flagged) * updated moderation categories --------- Co-authored-by: Matthew Ashton <mashton-gitlab@zhero.org> 2023-07-11 23:50:08 +02:00
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`response = OAImoderations.moderations(input)`
			`return JSONResponse(response)`
lint 2023-07-12 20:33:25 +02:00

Add types to the encode/decode/token-count endpoints 2023-11-08 04:05:36 +01:00			`@app.post("/v1/internal/encode", response_model=EncodeResponse)`
			`async def handle_token_encode(request_data: EncodeRequest):`
			`response = token_encode(request_data.text)`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`return JSONResponse(response)`
lint 2023-07-12 20:33:25 +02:00
[extensions/openai] various fixes (#2533) 2023-06-06 06:43:04 +02:00
Add types to the encode/decode/token-count endpoints 2023-11-08 04:05:36 +01:00			`@app.post("/v1/internal/decode", response_model=DecodeResponse)`
			`async def handle_token_decode(request_data: DecodeRequest):`
			`response = token_decode(request_data.tokens)`
			`return JSONResponse(response)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00

Add types to the encode/decode/token-count endpoints 2023-11-08 04:05:36 +01:00			`@app.post("/v1/internal/token-count", response_model=TokenCountResponse)`
			`async def handle_token_count(request_data: EncodeRequest):`
			`response = token_count(request_data.text)`
Add /v1/internal/stop-generation to OpenAI API (#4498) 2023-11-07 04:10:42 +01:00			`return JSONResponse(response)`


			`@app.post("/v1/internal/stop-generation")`
			`async def handle_stop_generation(request: Request):`
			`stop_everything_event()`
			`return JSONResponse(content="OK")`


Add /v1/internal/model-info endpoint 2023-11-08 03:59:02 +01:00			`@app.get("/v1/internal/model-info", response_model=ModelInfoResponse)`
			`async def handle_model_info():`
			`payload = OAImodels.get_current_model_info()`
			`return JSONResponse(content=payload)`


add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00			`def run_server():`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`server_addr = '0.0.0.0' if shared.args.listen else '127.0.0.1'`
			`port = int(os.environ.get('OPENEDAI_PORT', shared.args.api_port))`

			`ssl_certfile = os.environ.get('OPENEDAI_CERT_PATH', shared.args.ssl_certfile)`
			`ssl_keyfile = os.environ.get('OPENEDAI_KEY_PATH', shared.args.ssl_keyfile)`

			`if shared.args.public_api:`
			`def on_start(public_url: str):`
			`logger.info(f'OpenAI compatible API URL:\n\n{public_url}/v1\n')`

			`_start_cloudflared(port, shared.args.public_api_id, max_attempts=3, on_start=on_start)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00			`else:`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`if ssl_keyfile and ssl_certfile:`
			`logger.info(f'OpenAI compatible API URL:\n\nhttps://{server_addr}:{port}/v1\n')`
Add HTTPS support to APIs (openai and default) (#4270) --------- Co-authored-by: oobabooga <112222186+oobabooga@users.noreply.github.com> 2023-10-13 06:31:13 +02:00			`else:`
Make OpenAI API the default API (#4430) 2023-11-06 06:38:29 +01:00			`logger.info(f'OpenAI compatible API URL:\n\nhttp://{server_addr}:{port}/v1\n')`

			`if shared.args.api_key:`
			`logger.info(f'OpenAI API key:\n\n{shared.args.api_key}\n')`

			`uvicorn.run(app, host=server_addr, port=port, ssl_certfile=ssl_certfile, ssl_keyfile=ssl_keyfile)`
add openai compatible api (#1475) 2023-05-03 03:49:53 +02:00

			`def setup():`
			`Thread(target=run_server, daemon=True).start()`