일단 잘 쓴 글을 많이 보고 참조해보는 것인데요. 글의 내용과 형식, 구성 등 여러가지 측면을 참조해보시면 좋습니다. 글 자체의 퀄리티는 판단하기 어렵지만,노출이 잘되어있는 글은 일단 로직 상에서 좋은 글로 평가되고 있을 가능성이 높으므로노출 순위가 높은 글들 위주로 (특히 스마트블록을 위주로) 참조해보시면 도움이 많이 됩니다. 아래 글에서 다른 글을 벤치마킹할때 고려해야 하는 요소들을 이야기한바 있습니다. 블로그 노출 알고리즘의 비밀[참고 자료] 그 가운데 단순 텍스트 원고도 중요한 파트인데요. 관련해서원고 분석 기능을 제가 만든 마케팅 도우미에 추가했습니다. 블로그 상위노출 로직에 대해 공부할때 많이 다루는 형태소 분석 들어보신 분들 계실거에요. 쉼터에도 관련 글이 있으니 참고하시면 도움이 되실거고요. 원장님 블로그 원고 점수를 올려줄 무료 사이트들[참고 자료] 형태소 분석을 해주는 여러 서비스가 있는데, 유료인 경우도 있고 해서이거 한번 만들어봐야겠다는 생각을 했습니다. 그러면서 관련 지식도 공부해보는 거죠... 한국어 문장의 최소 단위를 형태소라고 하는데글을 넣으면 형태소 단위로 분해해서 형태소와 품사를 태깅해주는 라이브러리들이 있습니다. 위와 같이 몇가지가 있고요. 저 중에 konply, mecab을 활용해서 만들어봤습니다. 형태소 분석에 사용되는 라이브러리들은 단어 사전 등을 포함하는 등용량도 크고 설치 이슈가 좀 있어서 초기 세팅에서 고생을 좀 했습니다; 블로그 주소를 입력하면원고를 바로 가져올 수 있도록 해놨는데요. 가져온 원고를 이어서 분석 버튼을 눌러서 분석하는 방식입니다.(블로그에서 안가져오고 바로 원고를 복붙해서 분석할 수도 있습니다) 내 원고를 분석하는데도 사용할 수 있지만,상위노출 되어 있는 다른 블로그의 글들을 분석함으로써로직 알고리즘을 분석하는 목적으로 활용하실 수 있습니다. 형태소 분석을 보여주는 사이트들에서 사용을 해보면엄밀한 의미에서는 형태소가 아니라 명사 분석에 가깝다는 생각이 듭니다. 서비스에 따라 제공하는 정보가 조금씩 다른거 같고요.형태소인지, 단일 명사인지, 복합단어인지 등… 라이브러리의 성능에 의해서도 결과값이 조금씩 달라지기도 합니다.네이버는 아마 자체적으로 보유한 형태소분석기나 구문트리 같은 걸 분석하는 걸로 보이기 때문에오픈소스 라이브러리의 값은 참고 삼아 보는 정도로 하시는게 좋겠습니다. 제가 쓰고 있는 유료 프로그램에서 원고 분석 결과인데요.단어, 형태소, 명사 등이 정확한 정의가 좀 모호하게 느껴지긴 합니다. 저는 복합어도 중요하다고 생각이 들어서,형태소 분석 결과 품사가 명사-명사 구조로 연속되는 경우에도 복합어로 간주해서 카운팅하는 방식으로 구현했습니다. 단일명사 + 복합어가 중요하다고 생각을 해서 그 위주로 카운팅이 되게끔 설계를 했습니다. 무엇을 카운팅할 것인지에 대한 기준이 서비스에 따라 조금씩 차이가 있다 정도로 이해하시면 될거 같습니다. 위와 같이 전체 글자수와 명사의 비중, 주요 단어들(단일명사와 복합어를 독립적으로 카운팅)을 확인할 수 있습니다. 형태소 가운데 품사 부분이 중요하게 작용하는게 아마 글의 유형 분석일건데요. 즉 후기성 글과 정보성 글을 판단하는 기준으로 품사의 절대 혹은 상대 빈도를 기준으로 판단할 수가 있습니다. 이런 기준을 바탕으로 임의의 기준을 설정하여원고 분석에서 후기성과 정보성 글의 구분하도록 해봤습니다. 머신러닝을 활용하는게 더 정확하겠지만 경향성 정도는 확인하는데 도움이 될 듯 합니다. 오늘은 여기까지이고, 블로그 운영하시는데 참고하시면 좋겠습니다. 사용해보시려면... 프로그램 다운로드하기 https://bit.ly/3UWoega 위 링크로 다운로드 하시면 되고요(용량이 조금 커서 직접 첨부가 안되네요.) 사용방법은 첨부된 파일을 다운로드해서 압축 풀고,starter.exe 실행하시고 조금 기다리시면 로그인 창이 뜨고요. (기존에 이미 다운로드 하신 분들의 경우, 자동으로 업데이트 다운로드가 되실거라,다시 다운로드 하지 않으셔도 됩니다.) 아직 제가 정확하게 최적화 방법을 잘 몰라서, 처음에 프로그램을 실행시키면 초기 로딩이 오래걸립니다. (빠르고 가볍게 실행되도록 하는 방법을 공부 중입니다.) 관심있는 분들은 사용해보시고, 필요한 기능이 있다면 요청해주시면반영해보도록 하겠습니다. (작동이 잘 안되는 경우에도, 댓글 남겨주시면 감사하겠습니다.)