<div dir="ltr">Hi Eric<div><br></div><div>1. It seems that I don't have sufficient GPU memory in colab.</div><div><br></div><div>I have the following error message:</div><div>INFO:colabfold.batch:Running model_1<br>/usr/local/lib/python3.7/dist-packages/haiku/_src/data_structures.py:195: FutureWarning: jax.tree_flatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_flatten instead.<br>  leaves, structure = jax.tree_flatten(mapping)<br>/usr/local/lib/python3.7/dist-packages/haiku/_src/data_structures.py:203: FutureWarning: jax.tree_unflatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_unflatten instead.<br>  self._mapping = jax.tree_unflatten(self._structure, self._leaves)<br>/usr/local/lib/python3.7/dist-packages/haiku/_src/stateful.py:457: FutureWarning: jax.tree_leaves is deprecated, and will be removed in a future release. Use jax.tree_util.tree_leaves instead.<br>  length = jax.tree_leaves(xs)[0].shape[0]<br>/usr/local/lib/python3.7/dist-packages/alphafold/model/geometry/struct_of_array.py:136: FutureWarning: jax.tree_flatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_flatten instead.<br>  flat_array_like, inner_treedef = jax.tree_flatten(array_like)<br>/usr/local/lib/python3.7/dist-packages/alphafold/model/geometry/struct_of_array.py:210: FutureWarning: jax.tree_unflatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_unflatten instead.<br>  inner_treedef, data[array_start:array_start + num_array])<br>/usr/local/lib/python3.7/dist-packages/alphafold/model/mapping.py:50: FutureWarning: jax.tree_flatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_flatten instead.<br>  values_tree_def = jax.tree_flatten(values)[1]<br>/usr/local/lib/python3.7/dist-packages/alphafold/model/mapping.py:54: FutureWarning: jax.tree_unflatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_unflatten instead.<br>  return jax.tree_unflatten(values_tree_def, flat_axes)<br>/usr/local/lib/python3.7/dist-packages/alphafold/model/mapping.py:129: FutureWarning: jax.tree_flatten is deprecated, and will be removed in a future release. Use jax.tree_util.tree_flatten instead.<br>  flat_sizes = jax.tree_flatten(in_sizes)[0]<br>ERROR:colabfold.batch:Could not predict af1819. Not Enough GPU memory? INTERNAL: cublas error<br>INFO:colabfold.batch:Done<br>Downloading structure predictions to directory Downloads/ChimeraX/AlphaFold<br>cp: cannot stat '*_relaxed_rank_1_model_*.pdb': No such file or directory<br>cp: cannot stat '*_unrelaxed_rank_1_model_*_scores.json': No such file or directory<br></div><div><br></div><div>2. Would it be possible to run this in jupyter? Or are there alternatives?</div><div><br></div><div>3. " Prediction may fail with total sequence length over 1000 residues due to limited GPU memory." - this total sequence length meaning all the sequences in the list to be concatenated?</div><div><br></div><div>4. I seem to also have some pdbxx.m8 and afxxxx.csv files - may I know what these files are for?<br></div><div><br></div><div>Thanks!</div><div>-Dennis</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, 6 Oct 2022 at 00:25, Eric Pettersen <<a href="mailto:pett@cgl.ucsf.edu">pett@cgl.ucsf.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Also, if you are copying the sequence from a text editor, make sure the editor is displaying the sequence as plain text or that you are copying as plain text, otherwise invisible formatting characters may be embedded in what you paste.<br>
<br>
--Eric<br>
<br>
        Eric Pettersen<br>
        UCSF Computer Graphics Lab<br>
<br>
<br>
> On Oct 5, 2022, at 9:14 AM, Elaine Meng via ChimeraX-users <<a href="mailto:chimerax-users@cgl.ucsf.edu" target="_blank">chimerax-users@cgl.ucsf.edu</a>> wrote:<br>
> <br>
> Well, the message says there is an invalid character, so all I can say is to make sure that you are pasting plain text, and check to see that you have only standard amino acid codes and commas.  <br>
> <br>
> WIthout seeing exactly what you pasted, we can't tell which part caused the problem.<br>
> <br>
> Elaine<br>
> <br>
> <br>
>> On Oct 5, 2022, at 9:09 AM, Dennis Poh <<a href="mailto:pohdennis90@gmail.com" target="_blank">pohdennis90@gmail.com</a>> wrote:<br>
>> <br>
>> Hi Elaine,<br>
>> <br>
>> Thanks, I was trying to predict a multimer or the overall structure of many subunit chains using individual sequences, each separated with a comma in colab.<br>
>> But it seems that there was some error and no pdb file was generated; the error message is as follows:<br>
>> <br>
>> ERROR:colabfold.batch:Could not generate input features af1848: Invalid character in the sequence:  <br>
>> Traceback (most recent call last):<br>
>>  File "/usr/local/lib/python3.7/dist-packages/colabfold/batch.py", line 1357, in run<br>
>>    model_type,<br>
>>  File "<ipython-input-1-d6881d38b934>", line 122, in generate_input_feature_wrapper<br>
>>    (input_features, domain_names) = batch.generate_input_feature_orig(*args, **kw)<br>
>>  File "/usr/local/lib/python3.7/dist-packages/colabfold/batch.py", line 1018, in generate_input_feature<br>
>>    sequence, input_msa, template_features[sequence_index]<br>
>>  File "/usr/local/lib/python3.7/dist-packages/colabfold/batch.py", line 869, in build_monomer_feature<br>
>>    sequence=sequence, description="none", num_res=len(sequence)<br>
>>  File "/usr/local/lib/python3.7/dist-packages/alphafold/data/pipeline.py", line 43, in make_sequence_features<br>
>>    map_unknown_to_x=True)<br>
>>  File "/usr/local/lib/python3.7/dist-packages/alphafold/common/residue_constants.py", line 580, in sequence_to_onehot<br>
>>    raise ValueError(f'Invalid character in the sequence: {aa_type}')<br>
>> ValueError: Invalid character in the sequence:  <br>
>> INFO:colabfold.batch:Done<br>
>> Downloading structure predictions to directory Downloads/ChimeraX/AlphaFold<br>
>> cp: cannot stat '*_relaxed_rank_1_model_*.pdb': No such file or directory<br>
>> cp: cannot stat '*_unrelaxed_rank_1_model_*_scores.json': No such file or directory<br>
>> <br>
>> -Dennis<br>
>> <br>
>> On Wed, 5 Oct 2022 at 23:36, Elaine Meng <<a href="mailto:meng@cgl.ucsf.edu" target="_blank">meng@cgl.ucsf.edu</a>> wrote:<br>
>> Hi Dennis,<br>
>> Your sequence input is wrong - it should contain only the sequences pasted as plain text, with only a comma between them (NOT the ">description" line because it is not supposed to be in fasta format).  How to input sequence(s) is explained in the AlphaFold help page.<br>
>> <br>
>> <<a href="https://rbvi.ucsf.edu/chimerax/docs/user/tools/alphafold.html#predict" rel="noreferrer" target="_blank">https://rbvi.ucsf.edu/chimerax/docs/user/tools/alphafold.html#predict</a>><br>
>> <br>
>> "For predicting a complex (multimer), the sequences of all chains in the complex must be given. The same sequence must be given multiple times if it occurs in multiple copies in the complex. The sequences can be specified either collectively as a model number chosen from the menu of currently open models (e.g. when that model contains multiple chains), or individually within a comma-separated list of UniProt identifiers or pasted-in amino acid sequences."<br>
>> <br>
>> E.g. something like<br>
>> <br>
>> ACCCC,ALLPAAAA<br>
>> <br>
>> I hope this helps,<br>
>> Elaine<br>
>> -----<br>
>> Elaine C. Meng, Ph.D.                       <br>
>> UCSF Chimera(X) team<br>
>> Department of Pharmaceutical Chemistry<br>
>> University of California, San Francisco<br>
>> <br>
>>> On Oct 5, 2022, at 4:12 AM, Dennis Poh via ChimeraX-users <<a href="mailto:chimerax-users@cgl.ucsf.edu" target="_blank">chimerax-users@cgl.ucsf.edu</a>> wrote:<br>
>>> <br>
>>> Sorry, I couldn't generate the pdb from chimera colab - is there anything that i may have missed?<br>
>>> <br>
>>> -Dennis<br>
>>> <br>
>>> On Wed, 5 Oct 2022 at 17:11, Dennis Poh <<a href="mailto:pohdennis90@gmail.com" target="_blank">pohdennis90@gmail.com</a>> wrote:<br>
>>> Hi <br>
>>> <br>
>>> I encounter a problem in multimer prediction with the sequences I use as input.<br>
>>> It's always indicating:<br>
>>> "Missing or invalid "sequences" argument: Sequences argument"<br>
>>> and " is not a chain specifier, alignment id, UniProt id, or sequence characters"<br>
>>> <br>
>>> The input format is always something like a fasta format:<br>
>>>> seq_id<br>
>>> ACCCC<br>
>>> <br>
>>>> seq_id2<br>
>>> ALLPAAAA<br>
>>> <br>
>>> May I know how I can rectify this?<br>
>>> <br>
>>> Thanks!<br>
>>> - Dennis<br>
>> <br>
> <br>
> <br>
> _______________________________________________<br>
> ChimeraX-users mailing list<br>
> <a href="mailto:ChimeraX-users@cgl.ucsf.edu" target="_blank">ChimeraX-users@cgl.ucsf.edu</a><br>
> Manage subscription:<br>
> <a href="https://www.rbvi.ucsf.edu/mailman/listinfo/chimerax-users" rel="noreferrer" target="_blank">https://www.rbvi.ucsf.edu/mailman/listinfo/chimerax-users</a><br>
<br>
</blockquote></div>