안녕하세요, 파이썬 강의 중에
https://youtube.com/playlist?list=PLBcT2bWZuRNrSOu4vq8nM5eSWiN65-DvG&si=xRv9638kU6Fk4Zzz
헨리의 퀀트대학 강의가 있는데
이 강의를 들으면 다트 api를 사용해서 상장 이후 지금까지의 재무정보를 한번에 다운 받을 수 있나요?
코딩 문외한이라 여쭤봅니다..
안녕하세요, 파이썬 강의 중에
https://youtube.com/playlist?list=PLBcT2bWZuRNrSOu4vq8nM5eSWiN65-DvG&si=xRv9638kU6Fk4Zzz
헨리의 퀀트대학 강의가 있는데
이 강의를 들으면 다트 api를 사용해서 상장 이후 지금까지의 재무정보를 한번에 다운 받을 수 있나요?
코딩 문외한이라 여쭤봅니다..


세상 그렇게 간단하지 않읍니다... ㅠ 파이썬 어느 정도 쓸 줄 아시면 재무제표 정도는 자동추출하기는 좀 편하실겁니다 https://github.com/josw123/dart-fss 이거 써보시길

헉 그러면 5개년이라도 주석사항은 좀 쉽게 다운하고 싶은데 그런것도 불가능한가요...? 제가 코딩은 진짜 문외한이라 주신 깃허브 보면서 공부해보겠습니다! 데이타 다운받고 정리하는 시간을 줄여보고 싶어서요!

재무제표는 XBRL로 이제 제공이 되서, 제가 제공해드린 패키지로는 가능합니다. 20년치도 돼요. 단시간에 너무 많이 호출하면 블락당하니까 주의하시구요. 대신 주석은 xml parsing을 해야되는데... 이게 조금만 옛날로가도 공백이니 뭐니 전처리할게 너무 많아서 수기로 하는게 빨랐습니다 저는

오 진짜 감사합니다!! 저걸 먼저 공부해야겠군요!

Gloria님 혹시 상장 이후 주가 데이터는 네이버 html에서 가져오면 되는걸까요??

네이버는 수정주가가 아니어서... KRX에서 크롤링하는게 답이긴 한데 이게 또 아예 전처리가 없어도 되는 것은 아닌지라...

KRX 2년치만 주어지던데 그거 크롤링하면 10년치도 받을 수도 있고 한건가요?? 죄송합니다...찾아봐도 명확하게 안나와서...

KRX 크롤링하는 코드가 엄청 복잡해서 굳이 추천을 안하시는거죠...?

예 됩니다. 코드 올리긴 좀 그래서 명시적으로 가르쳐드리긴 뭐한데... 20년치도 다 뽑을 수 있어요. 근데 과거 데이터는 전처리 좀 해줘야 하는 수준입니다.

엄청 복잡하진 않은데, 처음하시면 좀 복잡할 수도 있어요. 은근 크롤링이나 그런 데이터 수집하고 하는거도 시행착오를 많이 겪어야 하는지라

아하 감사합니다!! 방향 설정해주셔서 감사합니다 ㅠㅠㅠ 아 역시 쉬운일 하나 없네요 ㅎㅎ 노가다 좀 덜려했더니..

다트api 문서 살펴보니, 전체 재무제표는 사업연도 2015년 이후라고 되어있네요. 주요 재무지표는 2023년 3분기 이후로 되어있습니다. 아무래도 데이터 저장과 조회에도 돈이 들다보니, 다트쪽에서 open api 형태로 제공하는 정보가 한정되어있는거 같습니다. api 사용은 단순히 api key 받으시고 url로 통신하는 방식이라 파이썬이 아니어도 텍스트로된 데이터를 받으실수있어요. 말씀하신것처럼 정보를 가져오는 GET 형태만 사용하신다면 그냥 주소창에 주소와 주소뒤에 물음표를 붙이고 파라미터를 치는 것 만으로 데이터 조회가 가능합니다. 무료 gpt가 해당사항은 더 쉽게 예시를 들어줄거에요.

아하 그러면 일단 html 보는 법을 어느정도 알아야겠네요 ㅎㅎ

API로 항목 별로 받을 수 있는 건 2015년 이후 데이터이고, 그 이전 데이터 가져오시려면 텍스트 다 가져와서 원하는 부분 잘라내서 가져오셔야 해요.

아하 감사합니다!!

본격적으로 공부하시기 전에 먼저 XBRL 데이터 받으셔서 공시 정보랑 비교해보심이 좋을 것 같습니다. 저도 코스피 기업 크롤링을 하려다 위에 Gloria님 말씀대로 전처리해줄 것이 너무 많아 포기했습니다. 전자공시 양식이 개별기업마다 조금씩 다 달라서 그런지 공백, 데이터 오류 문제가 많아서 원하는 프로그램을 만들지 못하겠더군요. (게다가 연결기업 기준으로만 정리되었던 걸로도 기억합니다. 저는 개별기업 정보도 필요했던지라..) 지금은 좀 나아졌을 것 같은데 아마 과거 데이터는 여전히 정리가 안 되어 있을 것 같습니다. 먼저 데이터들을 임시로 봐보시고 원하시는 프로그램에 맞는 양식일지 고려해보심이 좋을 것 같습니다.

허허 너무 쉽게 생각했나보군요 ㅎㅎㅎ 감사합니다! 그냥 노가다 해야겠습니다....ㅋㅋㅋ