--- language: [en, ko] license: unknown tags: - roberta - sequence-classification - code - small inference: false library_name: transformers pipeline_tag: text-classification datasets: - dacon --- # code-sim-roberta-small RoBERTa-small을 코드 유사도 분류 태스크로 파인튜닝한 가중치입니다. Task : https://dacon.io/competitions/official/235900/overview/description Decription : 두 코드간 유사성(동일 결과물 산출 가능한지) 여부를 판단할 수 있는 AI 알고리즘을 개발 사용 pretrained_model : "hosung1/roberta_small_mlm_from_scratch" 사용 Datasets : Dacon제공 ## How to use ```python from transformers import AutoTokenizer, AutoModelForSequenceClassification tok = AutoTokenizer.from_pretrained("hosung1/code-sim-roberta-small") mdl = AutoModelForSequenceClassification.from_pretrained("hosung1/code-sim-roberta-small")